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Gegenstand der Erfindung ist eine thermostabite Ligase aus Archaebakterien, Nukleinsauren, welche fUr 
diese Ligase kodieren, und ein Verfahren zum Nachweis von Nukleinsauren unter Verwendung dieser 
Ligase. 

Ganz allgemein sind Ligasen Enzyme, welche bereits bestehende Enden von Polynukleotiden verkniip- 
fen (zusammenfassend: P. Higgins, N.R. Cozzareili 1989 in Recombinant DNA Methology S. 3-24). Bei einer 
Ligasereaktion wird die Bildung einer Phosphodiesterbindung zwischen einer freien S'-Phosphatgruppe und 
einer im gleichen Strang eines doppelstrangigen DNA-Mofekiils gegenuberliegenden, freien 3'-Hydroxyl- 
gruppe katalysiert Die Ausbildung der Phosphodiesterbindung ist gekoppelt an die Spaltung einer Pyro- 
phosphatbindung in einem fur die Reaktion notwendigen Co-Faktor. Dabei sind sowohl intra- als auch 
intermolekuiare Reaktionen moglich. Ligasen spielen eine wichtige Rolle bei der DNA- Replication und bei 
der Reparatur von DNA-Schaden. Man unterscheidet prinzipiell zwischen zwei Typen von DNA Ligasen. Der 
erste Typ ist aus Eukaryonten und Bacteriophagen der T-Serie bekannt und benotigt ATP als Cofaktor. Im 
Gegensatz hierzu sind die Ligasen aus Eubakterien (zweiter Typ) NAD-abhangig. Bekannte Beispiele fur 
bakterielle Ligasen sind zum einen die E-coli-Ligase, und fur Phagenligasen die Ligase des Bakteriophagen 

Die Ligasereaktion lauft prinzipiell in drei Schritten ab: 

- Adenylierung des freien Enzyms (dabei wird bei Co-Faktor NAD ein Nikotinamidmononukleotid und 
bei Co-Faktor ATP ein Pyrophosphat freigesetzt). Fur die genannten Beispiele liegt nach dieser 
Reaktion AMP uber die Epsilon-Gruppe eines Lysin-Restes gebunden vor. 

- Der AMP-Rest wird im zweiten Schritt vom Enzym zur 5'-Phosphatgruppe des freien DNA-Endes 
transferiert, wobei eine energiereiche Pyrophosphatbindung gebildet wird. 

- Im dritten Schritt der Ligasereaktion wird uber einen nukleophilen Angriff der gegenuberliegenden 3'- 
Hydroxylgruppe eine Phosphatdiesterbindung ausgebildet und die AMP-Gruppe entfernt. 

Eine thermostabile Ligase ist aus Thermus thermophilus (J. Biochem. 100, 123-132 (1986)) bekannt. 
Das Enzym hat ein Molekulargewicht von ca. 79.000 (J. Biol. Chem. Vol. 259, 16, S. 10041 bis 10047 
(1984)). Dieses Enzym benotigt Magnesium 24 oder Mangan 2+ sowie NAD als Cofaktoren, jedoch kein ATP. 
Das Enzym aus Thermus thermophilus HB 8 wurde auch erfolgreich in der Oligonukleotidligation der Ligase 
Chain Reaction (LCR) eingesetzt (WO 91/17239). Eine thermostabile, ATP-abhangige DNA-Ligase war 
bisher nicht bekannt. 

Aufgabe der vorliegenden Erfindung war es, eine thermostabile, ATP-abhangige Ligase zu finden. 
Bevorzugt soilte diese die Nachteile des Standes der Technik nicht aufweisen. ATP-Abhangigkeit ist 
namlich gegenuber NAD-Abhangigkeit wegen der Thermostability von ATP bevorzugt. 

Gegenstand der Erfindung ist daher eine thermostabile Ligase erhaltlich aus Archaebakterien. Ebenfalls 
Gegenstand der Erfindung sind Nukleinsauresequenzen, welche fur diese Ligase kodieren, ein Verfahren 
zum Nachweis von Nukleinsauren mit Hilfe dieser Ligase und ein Verfahren zur Isolierung eines Enzyms. 

Eine Ligase im Sinne der Erfindung ist ein Enzym, welches zwei benachbart an einen gemeinsamen 
Strang anhybridisierte DNA-Einzelstrange miteinander uber eine kovalente Phosphodiesterverbindung ver- 
knupft. Ligasen schiieBen somit Einzelstrangbruche in Nukleinsauredoppelstrangen unter Verknupfung einer 
5'-Phosphatgruppe einer Nukleinsaure mit der 3'-Hydroxylgruppe einer anderen Nukleinsaure. 

Die erfindungsgemafte DNA-Ligase wird in Archaebakterien codiert, insbesondere in der Ordnung der 
Sulfolobales und im speziellen in Desulfurolobus ambivalens (Bergey's Manual, Vol. 3, S. 2250-2253 (1984), 
Nature Vol. 313, S. 789-791 (1985), System. Appl. Mikrobiol. 8, 197-203 (1986)). Desulfurolobus ambivalens 
gehort genau wie eine groGere Anzahl weiterer extrem thermophiier, ungefahr zur gleichen Zeit isolierter 
Organismen zu dem erst kurz zuvor neu definierten Urreich der Archaebakterien (FEMS Microbiol. Rev. 75, 
117-124 (1990)). Ende der siebziger Jahre hatten sich die Befunde gehauft, dafi die "Prokaryonten" nach 
molekularen Kriterien in zwei fundamental verschiedene Organismengruppen zerfallen. Dies veranlafite 1977 
C.R. Woese und G.E. Fox, die Prokaryonten als phylogenetische Einheit aufzutrennen, indem sie einen Teil 
davon als gleichberechtigtes Urreich der Archaebakterien den ubrigen, den Eubakterien, gegenObersteliten 
und so die bis dahin als phylogenetisch bedeutsam angesehene Prokaryonten- Eukaryonten-Dichotomie 
durch eine Trichotomie ersetzten. Seither ist eine groBe Anzahl von bis dahin unbekannten Archaebakterien 
beschrieben worden, und auch die Erkenntnisse auf den Gebieten der Molekularbiologie und Biochemie der 
Archaebakterien haen das Bild der Gruppe als monophyletische Einheit des Lebens gefestigt (J. Mol. Evol. 
24, 167-173 (1986)). Mit der 1990 vorgeschlagenen Neubenennung der Domanen der Eucarya, Archaea und 
Bacteria als hochste Taxa anstelle der Urreiche der Eukaryonten, Archaebakterien und Eubakterien wurde 
dieser Weiterentwicklung Rechnung getragen. 

Desulfurolobus ambivalens aus der Ordnung der Sulfolobales wachst bei einer Temperatur von 55-85 • 
C und in einem Bereich von pH 0,8-4 (Optima 80 °C und pH 2,5). Es ist strikt chemolithoautotroph und kann 
auf einem reinen Mineralmedium unter C0 2 -Assimilation durch Reduktion oder Oxidation von Schwefel 
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wachsen. 

Desulfurolobus ambivalens ist aus der offentlichen Sammlung der DSM unter Nr. 3772 erhaltlich. 
Aufgrund der nachfolgend gegebenen Identifikation des Enzyms kann das native Enzym nach bekannten 
Methoden (z.B. Proteinisolierung, Trennung nach Molekulargewicht oder Ladung und Aktivitatstest) aus 
5 Desulfurolobus ambivalens isoliert werden. 

Die erfindungsgemaBe Ligase ist bevorzugt zwischen 560 und 750 Aminosauren lang. Besonders 
bevorzugt betragt die Lange des erfindungsgemaBen Enzyms ca. 600 Aminosauren. 

Die erfindungsgemaBe Ligase ist abhangig von ATP als Cofaktor. Die Aminosauresequenz der DNA- 
Ligase aus Desulfurolobus ambivalens ist in FIG 1 angegeben. Die Homologie dieser Aminosauresequenz 
w mit eukaryonten DNA-Ligasen betragt nur ca. 30-35 % (FIG 4). Die Homologie zu Phagenligasen ist noch 
niedriger. Nennenswerte Homologien zu NAD-abhangigen Ligasen aus Eubakterien konnten (mit Ausnahme 
des AMP-bindenden Motivs) nicht gefunden werden. Die erfindungsgemaBe DNA-Ligase enthalt daher 
entweder die Aminosauresequenz der FIG 1 oder einen Teil dieser Aminosauresequenz, der mehr als 50 
Aminosauren lang ist und Ligasenaktivitat aufweist, oder eine Aminosauresequenz, die zu mindestens 40 
75 %, bevorzugt mindestens 60, besonders bevorzugt mindestens 90 % homolog zu einer der genannten 
Sequenzen ist und Ligaseaktivitat aufweist. Sie hat ferner bevorzugt weniger als 30 % Homologie zu der 
Aminosauresequenz von eukaryonten DNA-Ligasen. Das Enzym hat bevorzugt ein Molekulargewicht zwi- 
schen 60 und 80 kD, besonders bevorzugt von ca 67 kD. Der isoelektrische Punkt des Proteins aus D. 
ambivalens (aus der Aminosauresequenz berechnet) ist 6.21. Die Gesamtladung betragt -6. Der Gehalt an 
20 hydrophoben Aminosauren (I + L + V + M) ist 26.2 %, was innerhalb des Bereiches anderer bekannter 
DNA-Ligasegene liegt (20.6 - 26.8 %). 

Das erfindungsgemaBe Enzym ist bei Temperaturen von liber 55 °C, bevorzugt zwischen 75 und 95 *C, 
besonders bevorzugt bei etwa 80 «C, stabil. Insbesondere ist das Enzym stabil unter Bedingungen, welche 
die mehrmalige Behandlung von Nukleinsauren unter thermisch denaturierenden Bedingungen beinhalten. 
25 Besonders bevorzugt ist das Enzym saurestabil von pH 4 bis pH 8.5, bevorzugt im Bereich von pH 6-7.5. 
Das erfindungsgemaBe Enzym ist aktiv mindestens in dem Intervall von 50-85 ° C, insbesondere zwischen 
50 und 60 ft C. 

GroBere Mengen des Enzyms konnen auch durch rekombinante Herstellung gewonnen werden. Dazu 
wird eine fur das Enzym kodierende Nukleinsaure in einen Vektor eingebracht und in einem geeigneten 
30 Wirt zur Expression gebracht. Die erforderlichen Arbeitsschritte fur die molekulare Klonierung eines Gens 
sind prinzipiell aus Sambrook, Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour 
Laboratory Press (1989) bekannt. Die fur die Ligase kodierenden Nukleinsauren (DNA) konnen in Archaeb- 
akterien, speziell in Sulfolobales , beispielsweise mit Oligonukleotiden der SEQ ID Nrn. 1 bis 4 identifiziert 
werden. 

35 Ein Vektor, welcher eine fur die erfindungsgemaBe Ligase kodierende Nukleinsaure enthalt, ist bei- 
spielsweise pDam-L3. Dieser Vektor wurde erhalten durch Klonierung eines 857 bp Hindlll/EcoRI DNA- 
Fragments von D. ambivalens in pUC18 (host strain E. coli JM 83, Klon pL 8/2). Dazu wurde genomische 
DNA endonukleolytisch verdaut und Southern-Transfer und Hybridisierung nach Standardvorschrift (Maniatis 
et al., Molecular Cloning, a laboratory manual, Cold Spring Harbour Laboratory Press (1989) und anschlie- 

40 Bende Identifizierung des Fragments mit 32 P-markiertem Oligonukleotid SEQ ID 1 durchgefuhrt. Die 
Oligonukleotide SEQ ID 2 und 3 wurden benutzt urn zwei verschiedene Pstl/Xbal Fragmente zu identifizie- 
ren und in pUCl8 (Plasmide pL1/2 und pL2/4) zu klonieren, welche den N-terminalen und den C-terminalen 
Teil des DNA-Ligase-Gens von Desulfurolobus ambivalens enthaiten (FIG 2). Danach wurde pDam-L3 aus 
diesen drei Klonen durch Ligation des EcoRI/Xbal Fragments von pL 2/4 in p-BluescriptllKS" (Stratagene), 

45 gefolgt vom EcoRWHindlll-Fragment von pL 8/2 und dem Hindlll Fragment von pL 1/2 zusammenqesetzt 
(FIG 3). 

Urn das Gen in E.coli exprimieren zu konnen, wurde die codierende Sequenz mit Hilfe der Oligonukleo- 
tide SEQ ID NO 9 und SEQ ID NO 10 als Primer in einem PCR-Ansatz amplifiziert. Diese Primer enthaiten 
im 5'-Bereich zusatzlich eine fur das Resthktionsenzym BamHI-spezifische Sequenz. Nach BamHI-Verdau 

so wurde das PCR-Fragment in den BamHI-gespaltenen Expressionsvektor pQE-8 kloniert (Diagen, QIAexpress 
Vektor Kit SRF, Literatur: The QIAexpressionist; Stuber et al., 1990, in Immunologcial Methods, eds. I. 
Lefkovits and B. Pernis, Vol. IV, 121-152). Das neukombinierte Plasmid wurde pQE-L6 bezeichnet. Nach 
Transformation in den E.coli-Stamm M15 wurde das Expressionsprodukt wie in Beispiel 8 gereinigt. Dabei 
enthalt M15 zusatzlich das Plasmid pREP4, welches fur das Neomycinphosphortransferase-Gen (neo) und 

55 das lacl-Gen (= lac- Repressor) codiert. Das neo-Gen vermittelt dem Stamm eine Kanamycin-Resistenz 
(zusatzlich zu der Ampicillin-Resistenz, welche uber pQE-L6 eingebracht wurde). Der mit dem Plasmid 
pQE-L6 transformierte Stamm M 15 wurde bei DSM (Deutsche Sammlung von Mikroorganismen und 
Zellkulturen) unter Nr. 7070 am 19.05.1992 hinterlegt 

3 



BNSDOCID: <EP_ 



.0571880A1_L> 



EP 0 571 880 A1 



D.e erfindungsgemaBen Nukleinsauren hybridisieren nur mit DNA aus Sulfolobus acidocaldarius und 
Sulfolobus shibatae. Hybridisierung mit genomischen Sequenzen der Ligasegene von Organismen aufler- 
halb der Archaebakterien fand auch unter relaxierten Bedingungen nicht satt. Dies bedeutet, daB das 
L,gase-Gen e.ne Nukleotidsequenz hat, die sich stark von der der bekannten Ligasegene unterscheidet und 
dafi d.e Ligasegene aus Archaebakterien und insbesondere von Sulfolobacae. untereinander starke Ahnlich- 
keiten zeigen. 

Das Plasmid pDam-L3 enthalt drei offene Leserahmen, wovon die Sequenz von Basenpaar 908 bis 
2710 (FIG 1) der fur die Ligase kodierenden Sequenz entspricht. Die Sequenz kodiert fur ein Protein von 
67619 D (errechnet), welches 600 Aminosauren enthalt. Der GOGehalt der kodierenden Region fur die 
erfindungsgemaBe DNA-Ligase betragt ca. 36 %, leicht oberhalb des Gesamt-GC-Gehalts von Desulfurolo- 
bus ambivalens DNA (31 %). In FIG 1 ist die Nukleotidsequenz der erfindungsgemaBen Nukle insaure und 
die entsprechende Aminosauresequenz angegeben. 

Der Fachmann kann diese Nukleotidsequenz dahingehend abandern, daB sich keine Anderungen in der 
Aminosauresequenz ergeben (Degenerierung des genetischen Codes). Es ist anzunehmen. daB von 
Anderungen bis zu einem bestimmten Grad in der Nukleotidsequenz, welche auch zu Aminosaureanderun- 
gen fuhren, keinen EinfluB auf die Aktivitat der erfindungsgemSBen Ligase zu erwarten ist. Bevorzugt umfafit 
die Erfmdung somit auch Nukleinsauren, welche zu mehr als 40 %, bevorzugt mehr als 70 %, besonders 
bevorzugt jedoch mehr als 90 % zu der Sequenz in FIG 1 bzw. der genannten Teilsequenzen komplemen- 
tar sind. Auch in Bezug auf die Lange des Ligasegens ist anzunehmen, daB eine Abweichung von der 
Lange des Gens aus Desulfurolobus ambivalens in gewissem Umfang keine entscheidende Anderung der 
Funktion der Kodierung fur die erfindungsgemaBe Ligase bewirkt. Bevorzugt ist die Nukleinsaure minde- 
stens 150 bp, insbesondere zwischen 1000 und 3000 bp, lang. Die Nukleotidsequenz enthalt insbesondere 
em Motiv. welches fur eine ATP-Bindungsstelle der Aminosauresequenz KDGR kodiert. 

Die erfindungsgemaBe Nukleinsaure kann auch dahingehend definiert werden. daB ihr komplementarer 
Strang unter den Bedingungen 6xSSC, 50 % Formamid, Raumtemperatur oder auch stringenter mit nicht 
zum Vektor gehongen Sequenzen und somit Desulfurolobus -spezifischen Sequenzen der Nukleinsaure aus 
FIG 1, insbesondere dem Teil der Nukleotide Nr. 908 bis 2716. besonders bevorzugt 988-2457 aus pDam- 
L3 oder mit dem 3382 bp langen Xbal/Hindlll-Fragment aus Desulfurolobus ambivalens hybridisiert. 

Solche Nukleinsauren sind beispielsweise die Oligonukleotide der SEQ ID NO 1 - 4 und 7 - 10 Sie 
konnen beispielsweise als Primer zur templatabhangigen Extension (z.B. PCR) oder nach Einfiihrung einer 
Markierung als Nachweissonden fur Desulfurolobus ambivalens bzw. des Ligasegens eingesetzt werden. 

Ebenfalls Gegenstand der Erfindung ist ein Verfahren zum Nachweis von Nukleinsauren unter Verwen- 
dung der erfindungsgemaBen Ligase zur Verkntipfung zweier Nukleinsauren, welche in benachbarten 
Bereichen mit einer nachzuweisenden Nukleinsaure hybridisiert sind. 

Ein Beispiel fur einen Nachweis unter Verwendung einer Ligase ist in der EP-A-0 320 308 beschrieben 
Die Bedingungen fur die Ligase-Chain-Reaction konnen aus diesem Dokument ubernommen werden, wenn 
fur die dort beschnebene Ligase die erfindungsgemaBe Ligase eingesetzt wird. Die ATP-Abhangigkeit der 
erfindungsgemaBen Ligase muB jedoch berOcksichtigt werden. Aus diesem Grund sollte ATP wahrend der 
Ligasereaktion in einer Konzentration von mehr als 0.1 mmol/l, bevorzugt zwischen 0.1 und 20 mmol/l 
vorhanden sein. Die Konzentration von Polyethylenglykol (PEG) kann bei dem erfindungsgemaBen Verfah- 
ren 0 bis 20 % bevorzugt 5 bis 10 % betragen. 

Ein weiteres Verfahren zum Nachweis von Nukleinsauren, bei dem die erfindungsgemaBe Ligase zur 
Ligation von benachbarten Nukleinsauren eingesetzt werden kann, ist in WO 90/01069 beschrieben. Hierbei 
wird zunachst eine Lucke von wenigen Nukleotiden zwischen benachbart hybridisierten Nukleotiden durch 
Einbau von Mononukleosidtriphosphaten aufgefullt und die entstandene Lucke (ein sogenannter Nick) mit 
der Ligase geschlossen. 

In FIG 1 (FIG 1a und FIG 1b) ist die Nukleotidsequenz von pDam-L3, inklusive der vollstandigen 
Sequenz fur die DNA-Ligase aus Desulfurolobus ambivalens und pDam-L3 ORF 3 angegeben. sowie Teile 
der Sequenzen von pDam-L3 ORF 2 und 4. Unterstrichen: Box A; Fett: Transkriptionsstart. 

In FIG 2 ist das Klonierungs- und Sequenzierungsschema ftir Plasmid pDam-L3 gezeigt. 

Die gestrichelten Pfeile markieren Sequenzen, die mit den Oligonukleotiden L1 (SEQ ID NO 2) und L2 
(SEQ ID NO 3) gewonnen wurden und zur UberprUfung der Ligationsergebnisse dienten, durchzogene 
Pfeile die ubrigen Sequenzen, gewonnen durch Subklonierung der entsprechenden Fragmente. Die lang 
gestrichelte Linie markiert die Lage des DNA-Ligasegens, rechts und links gestrichell ist die Fortsetzung der 
Plasmide pL-1/2 und 2/4 angezeigt. 

FIG 3 enthalt die Plasmidkarte von pDam-L3 mit Restriktionsschnittstellen. Ebenfalls eingezeichnet sind 
die Orientierungen der Leserahmen. Die 0-Marke entspricht der 0-Marke von p-Bluescript IIKS" lig 
entspricht dem DNA-Ligasegen. 
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FIG 4 enthalt einen Vergleich der Aminosauresequenzen bekannter DNA-Ligasen. Auf der rechten Seite 
ist die Aminosaurenumerierung der individuelien Sequenz angegeben. Uber der Sequenz ist die Numerie- 
rung der langsten Ligasesequenz (H. sapiens) sowie eine besonders homologe Stelle (aa 587 bis 593) 
angegeben. Fettgedruckt sind hochkonservierte Teile. Der Pfeil zeigt die ATP-Bindungsstelle (Lysin). Ein 
5 Eintrag in der Konsensuslinie (letzte Zeile, Kons) wurde im Fall von mehr als 50 % Identitat gemacht. Ein 
Stern entspricht 1:1 Verteilung, GroSbuchstaben bedeuten Identitat uber alle verglichenen Sequenzen. 

FIG 5 zeigt einen paarweisen Vergleich der bekannten DNA-Ligasesequenzen unter EinschluB der RNA- 
Ligase von Bacteriophagen T4 und der tRIMA-Ligase von S. cerevisiae. Im oberen rechten Dreieck sind die 
paarweisen Identitaten (%), bestimmt mit dem Programm GAP, angegeben, im unteren linken Dreieck die 
10 Signifikanzanalyse der Sequenzhomologie mit dem Programm RDF 2. Alle Werte der RDF 2-Bestimmungen 
sind SD-Einheiten, dafi heifit die Trefferquote der paarweisen Ausrichtung wurden durch die Standardabwei- 
chungen der zufalligen Ausrichtungen geteilt. In der mittleren Diagonale sind zur Kontrolle die RDF 2- 
Ergebnisse der Sequenzen mit sich selber aufgetragen. In Klammern ist die Lange der jeweiligen Sequenz 
in Aminosauren angegeben. In beiden Fallen wurde die jeweils langere Sequenz auf die Lange der 
75 kurzeren Sequenz reduziert, urn Zufallsubereinstimmungen auszuschliefien. 

In FIG 6 sind die Ergebnisse der Transkriptionsstudien an Gesamt-RNA aus D. ambivalens gezeigt. 
Fette Pfeile: Hauptstart- und Terminationssignale. Unterstrichen: Box A und Box B Motived 

In FIG 7 ist die Plasmidkarte von pQE-L6 gezeigt. Charakteristische Restriktionsstellen fur das 
Ligasegen sind angegeben. Die Details der Vektorkonstruktion sind zu entnehmen aus "QIA-Expressionist 
20 (DIAGEN GmbH, Dusseldorf, BRD)". 

Die Erfindung wird durch die folgende Beispiele weiter erlautert: 

Beispiel 1 

25 Identifizierung des DNA-Ligase-Gens in Desul furolobus ambivalens 

Chromosomale DNA von D. ambivalens wurde aus anaerob gezogenen Zellen nach gangrgen Methoden 
prapariert (ZellaufschluB mit SDS, Phenol- und Chloroformextraktionen, Ethanolfallung, zweimalige CsCI- 
Dichtegradientenzentrifugation (Molecular Cloning; A laboratory manual CSH Laboratory Press 1989). 

30 Gesamt-RNA aus anaerob und aerob gezogenen Zellen wurde mittels der Guanidinium-Thiocyanat-Methode 
prapariert (Anal. Biochem. 162, 156-159 (1987)). Die Preparation von Plasmiden erfolgte nach Angaben des 
Herstellers uber Quiagen-Saulen geeigneter Kapazitat. 

Oligodesoxynukleotide SEQ ID NO 1-4 und 7-10 wurden auf einem DNA Synthetisator 381 (Applied 
Biosystems, Weiterstadt) synthetisiert. 

35 Die Oligonukleotide wurden mit - 32 P-ATP endmarkiert, indem sie in PNK-Puffer (J. Mo!. Evol. 24, 167- 
173 (1986)) im Verhaltnis 1 pmol Oligonukleotid zu 10 uCi mit 5 U T4-Polynukleotidkinase fur 30 min bei 
Raumtemperatur inkubiert wurden. Die Prahybridisierung von Filtern erfolgte in 6 x SSC, 1 x Denhardt's 0,5 
% SDS, 20 ug/m! tRNA (E. coli) und 0,05 % tetra-Natriumdiphosphat-10-hydrat bei 65 *C fur 30-120 min. 
Die Hybridisierung erfolgte in dem oben genannten Puffer mit dem Unterschied, daB nur 0,1 % SDS 

40 zugegeben wurde. Hybridisierungstemperatur und -zeit wurden empirisch ermittelt. In der Regel wurden die 
Filter nach der Hybridisierung einmal fur 15 min bei Raumtemperatur in 1 x SSC/0,5 % SDS gewaschen 
und einmal fur 30 min bei der als optimal ermittelten Hybridisierungstemperatur. Koloniehybridisierungen 
(Molecular Cloning loc. cit.) wurden grundsatzlich genauso behandelt. 

45 Beispiel 2 

Klonierung 

Ein 857 bp groBes Hindlll/EcoRI-Fragment wurde in pUC 18 (Amersham, Braunschweig) (pL 8/2) 
so kloniert, nachdem es durch Spaltung genomischer DNA, Southern-Transfer und Hybridisierung mit dem 
- 32 P-markierten Oligonukleotid Soxi (SEQ ID NO 1) identifiziert worden war. 

Von der Nukleinsauresequenz von pL-8/2 wurden zwei weitere Oligonukleotide abgeleitet, mit deren 
Hilfe zwei Pstl/Xbal-Fragmente identifiziert und kloniert wurden, die das N-terminale (pL-1/2, Oligonukleotid 
SEQ ID NO 2) und das C-terminale (pL-2/4, Oligonukleotid SEQ ID NO 3) Ende des Genes enthielten. 
55 Letzteres enthielt offenbar aufgrund einer Doppelligation oder partielier Spaltung noch eine interne Xbal- 
Schnittstelle (FIG 2). Ausgehend von den drei teilweise uberlappenden Klonen wurde das Plasmid pDam-L3 
zusammengesetzt, das die vollstandige genetische Information fur die DNA-Ligase trug. Dazu wurden das 
EcoRI/Xbal-Fragment von pL2/4 zunachst in pBluescript II KS~ (Stratagene Cloning Systems La Jolla, USA) 
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kloniert, gefolgt von dem EcoRI/Hindlll-Fragment von pl_a'2 und dem Hind Ill-Fragment von pLl/2. Die 
Ergebnisse der einzelnen Klonierungsschritte wurden jeweils durch Doppelstrangsequenzierung mit den 
Oligonukleotiden SEQ ID NO 2, 3, 13und 14 uberpruft (vgl. FIG 2). 

Das resultierende Plasmid pDam-L3 enthielt ein DNA-Fragment von 3382 bp Lange mit der vollstandi- 
5 gen Information fur die DNA-Ligase von D. ambivalens und des weiteren ca. 900 bp stromauf und ca. 700 
bp stromab (FIG 3). 

Beispiel 3 



Subklonierung und Sequenzierung v on pDam-L3 

Geeignete Restriktionsfragmente wurden in die Vektoren M13mp10, M13tg131, M13mp18, M13mp19 
(Amersham, Braunschweig BRD), bzw. in die vier pBluescript- Vektoren (Stratagene Cloning Systems, La 
Jolla, USA) kloniert. Die Sequenzierstrategie ist in FIG 2 dargestellt. Sequenzreaktionen wurden je nach 

75 Erfordernissen mit Einzel- Oder Doppelstrangmatrizen gemacht. Sequenzreaktionen mit in M 13- Vektoren 
subklonierten Fragmenten wurden mit einem Universal-Oligonukleotid gestartet (= -40-Oligo des Sequena- 
se Kits, United States Biochemical Corporation, Cleveland, Ohio, USA, SEQ ID NO 11), Reaktionen in pUC 
mit dem Universal bzw. dem reversen - 40 Oligonukleotid (fur das reverse Oligonukleotid wurden die 
Angaben in Nucl. Acids Res. 17, 4897 (1989) berucksichtigt), diejenigen in pBluescript- Vektoren je nach 

20 Erfordernissen mit den Oligonukleotiden SEQ ID NO 13und 14. Bei letzteren wurde je nach Orientierung 
des Fragmentes im Vektor der Einzelstrang nach Infektion mit dem Helferphagen VPS13 (Stratagene 
Cloning Systems) fur die Sequenzierung prapriert, Oder aber das Fragment Doppelstrang-sequenziert. 
Zusatzlich wurden Doppelstrang-Sequenzierungen mit spezifisch synthetisierten Oligonukleotiden oder den 
Sucholigonukleotiden gemacht (s.o.). Fur die Sequenzreaktionen wurde der Sequenase-Kit entsprechend 

25 den Anleitungen des Herstellers verwendet (United States Biochemical Corporation). Sequenzgele, gegos- 
sen mit Sequagel-Losungen (National Diagnostics Corporation, Manville, New Jersey, USA), wurden in 
Makrophor-Sequenzierkammern gefahren (Pharmacia, LKB, Freiburg). 

Ergebnisse 

30 

Die vollstandige Nukleotidsequenz und ihre Ubersetzung in die Aminosauresequenzen sind in FIG 1 
dargestellt. Vier offene Leserahmen innerhalb des sequenzierten Bereiches wurden naher analysiert. Der 
langste (bp 908-2710, FIG 2) enthielt die Information fur ein hypothetisches 67617 Da-Protein bestehend 
aus 600 Aminosauren. Von den drei weiteren analyisierten Leserahmen begann einer bei bp 2961 und ging 
35 uber das Ende der sequenzierten Region hinaus (pDam-L3-ORF 2), der zweite uberspannte bp 771-250 
(pDam-L3-ORF 3, vgl. FIG 3), der Anfang des dritten lag im nicht sequenzierten Bereich von pL1/2 und 
endete bei bp 273 (pDam-L3-ORF4). 

Beispiel 4 

40 

Alignment mit pro-/eukaryonten DNA/RNA-Ligase n 

Die erhaltenen Nukleotidsequenzen wurden mit Hilfe des Prog ram mpaketes UWGCG, (Nucl. Acids Res. 
12, 387-395 (1984)) Version 7.0 (1991) analysiert. Vergleiche von offenen Leserahmen mit in der Genbank 

45 Mipsx (Martinsried) gespeicherten Sequenzen wurden mit Hilfe des Programmes PIRFASTA (Meth. Enzy- 
mol. 183, 63-99 (1990)) angestellt. Die verfugbaren Aminosauresequenzen der DNA-Ligasen von Schizosac- 
caromyces pombe (Enz. J. Biochem. 162, 659 (1987)), Saccharomyces cerevisiae (Nucl. Acids. Res. 13 
8323-8337 (1985)), Escherichia coli (Mol. Gen. Genet. 204, 1-7 (1986)), Thermus thermophilus (J. Bacteriol. 
173, 5047 (1991)), der menschlichen DNA-Ligase I (Proc. Natl. Acad. Sci. USA 87, 6679 (1990)), der 

so Vaccina Virus DNA-Ligase Nucl. Acids Res. 17, 9051-9062 (1989), der Ligasen der E. coli-Bakteriophagen 
T3, J. Mol. Biol. 479-495 (1987), T4, Nucl. Acids Res. 11, 7145-7156 (1983), T6, Dokl. Akad. Nank SSSR 
299, 737-742 (1988) und T7, J. Mol. Biol. 148, 303-330 (1981) der RNA-Ligase von T4, EMBO J. 3, 397-402 
(1988) und der tRNA-Ligase von S. cerevisiae, J. Biol. Chem. 263, 3171-3176 (1988) wurden Sequenzver- 
gleichen mit dem Programm GAP unterworfen, urn die paarweisen Identitaten zu bestimmen (FIG 5). Nicht 

55 berucksichtigt wurden die Aminoacyl-tRNA-Ligasen, die eine ganz andere Funktion ausuben. Die Signifi- 
kanzanalyse der paarweisen Ausrichtungen wurde mit dem Programm RDF2 durchgefuhrt. Dieses Pro- 
gramm vergleicht die Ergebnisse von paarweisen Ausrichtungen mit den Ergebnissen einer einzugebenden 
(hier: 1000) Anzahl von Ausrichtungen, bei dem die eine der beiden Sequenzen in zufalliger Weise 
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aufgebrochen und gemischt wird (= "shuffeln"), und es berechnet die Standardabweichung daraus. In FIG 
5 sind die Vielfachen des Ergebnis der Ausrichtung geteilt durch die Standardabweichungen angegeben 
(SD-Einheiten). Es wurden Tests in beiden Richtungen durchgefuhrt, d.h. von zwei Sequenzen wurden 
beide jeweils einmal intakt gelassen und "geshuffelt" und die beiden Ergebnisse gemittelt. Da die ATP- 
5 abhangigen DNA-Ligasen am C-terminalen Ende starker konserviert waren, wurden die jeweils langeren 
Sequenzen von N-Terminus her auf die gleiche Lange gekurzt. 

Die sich aus den paarweisen Vergleichen ergebenden Prozentwerte der Identitaten, bzw. der Vielfachen 
der Standardabweichungen von paarweiser und zufalliger Ausrichtung (RDF2) der Aminosauresequenzen 
der DNA-Ligasen sind in FIG 5 dargestellt. Auffallend ist hier, daB die DNA-Ligase von D. ambivalens bei 
w alien Unterschieden mehr als 30 % Sequenzidentitat zu alien vier bekannten ATP-abhangigen DNA-Ligasen 
der Eukarya hat und Werte zwischen dem 48- und 86-fachen der Standarbweichung in der RDF2 aufweist 
(FIG 5). Die RDF2-Ergebnisse der einzelnen Sequenzen, kontrollhalber gegen sich selber getestet (100 % 
Identitat) lagen im Bereich zwischen 200 und 450 SD und waren vorwiegend von der Lange der Sequenz 
abhangig. Keine signifikante Ahnlichkeit wurde zu den NAD-abhangigen, bakteriellen, cytoplasmatischen 
75 DNA-Ligasen von E. coli und Th. thermophilus gefunden <<20,4 % Sequenzidentitat; < 0,2 SD in der 
RDF2). Ebensowenig war eine Ahnlichkeit zu der ebenfalls ATP-abhangigen RNA-Ligase vom E. coli- 
Phagen T4 und der tRNA-Ligase von S. cerevisiae feststeilbar. Fur die T-Phagen-Ligasen lagen die 
Ergebnisse dazwischen. Die RDF2-Analyse ergab zwar keine signifikanten Resultate, die Identitatswerte 
lagen jedoch bei 20,2-23,7 %. Betrachtet man FIG 5, so fallen folgende Punkte auf:Die eukaryalen und die 
20 D. ambivalens -DNA-Ligasen bilden untereinander eng verwandte Gruppe. Die T4- und T6-Ligasen sind bis 
auf sechs Positionen identisch. Die T3- und T7-Ligasen sind mit 72 % Identitat ebenfalls eng verwandt, 
ebenso die NAD-abhangigen DNA-Ligasen von E. coli und Thermus thermophilus (46,7 %), dieses Paar ist 
mit dem Rest jedoch nicht verwandt. Die RNA-Ligasen sind weder untereinander noch mit dem Rest in 
Beziehung zu bringen. Die vier bekannten DNA-Ligasen der T-Phagen sind von den ubrigen ATP- 
25 abhangigen DNA-Ligasen deutlich getrennt. In der paarweisen Analyse liegen sie mit Identitatswerten von 
20,2-26,0 % uber dem Rest, in der Signifikanzanalyse weisen sie jedoch Werte urn den Nullpunkt auf. Sie 
konnen aber aufgrund konservierter Signaturen in die Ausrichtung der ATP-abhangigen DNA-Ligasen mit 
aufgenommen werden (s.u.). Die Vaccina-DNA-Ligase weist eine Zwischenstellung auf. Sie ist den ubrigen 
eukaryalen Enzymen nahe verwandt, erzielte aber auch Werte von 4,3-8,3 in der RDF2-Analyse mit den T- 
30 Phagen-Ligasen, sie verbindet somit die beiden Gruppen von Ligasen miteinander. 

Im folgenden werden nur die ATP-abhangigen DNA-Ligasen behandelt, da nur bei ihnen eine gemeinsa- 
me Ausrichtung moglich war. Fur alle anderen konnten keine gemeinsamen Strukturen im Sequenzvergleich 
gefunden werden, die sich von Zufallstreffern abheben. Die DNA-Ligasen unterscheiden sich in ihrer 
Gesamtlange erheblich (346-919 Aminosaurereste), wobei die eukaryalen generell langer als die T-Phagen- 
35 Ligasen sind (346-487 gegenuber 552-919 Aminosaurereste). Die Ausrichtungen der Protein sequenzen der 
eurkaryalen DNA-Ligasen untereinander zeigt viele konservierte Bereiche, die teilweise von Bereichen 
geringer Ahnlichkeit getrennt sind. Es war bereits in fruheren Untersuchungen aufgefallen, daB speziell im 
N-terminalen Bereich die Ligasen aus den Hefen und dem Menschen wenig konserviert sind, und man hatte 
daraus den SchluB gezogen, daB diese Teile der Sequenzen keinerlei Beziehungen zueinander hatten. Drei 
40 hoch konservierte Strukturen wurden bei alien wiedergefunden, die z. T. schon in fruheren Untersuchungen 
aufgefallen waren. Es handelte sich zum einen urn das ATP-bindene Zentrum, das allerdings nur bei der 
Rinderligase I experimentell bestimmt worden war. Nahe bei der beschriebenen Konsensussequenz 
KYDGXR (K ist ATP-bindend, Pos. 650) wurden noch zwei wahrscheinlich ebenfalls zum Zentrum gehoren- 
de Strukturen gefunden (Pos. 560: PMLA, bzw. PFKA bei T3 und T7; Pos. 610: SR). Zum zweiten wurde die 
45 von Barker et al. (1985) aufgrund ihrer Konservierung falschlicherweise als ATP-bindendes Zentrum 
vermutete Struktur bei Pos. 785-813 in der Ausrichtung wiedergefunden. Die dritte ist eine nahe dem C- 
Terminus liegende Struktur bei Pos. 945-960. Daruberhinaus erlaubten eine Reihe weiterer, weniger 
konservierter Strukturen die Ausrichtung der neun ATP-abhangigen DNA-Ligasen trotz geringer Signifikanz 
der Ahnlichkeiten zwischen T-Phagen und eukaryalen Ligasen. Das ATP-bindende Zentrum ist bei alien 
50 ATP-abhangigen DNA-Ligasen so hoch konserviert, daB die Zuordnung aufgrund der Sequenzhomologie 
zuverlassig erscheint. 

Beispiel 5 

55 Transkript-Analyse 

Die Initiation der Transkription der offenen Leserahmen in vivo wurde mittels Primerextensionsanalyse 
bestimmt (Proc. Natl. Acad. Sci. USA 87, 5851 (1990)). Die in-vivo Termination des DNA-Ligase-Genes 
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wurde durch S1-Kartierung mit einem a- 32 -P-ATP markiertem Ncol/SnaB I- Fragment (bp 2458-3221) als 
Sonde bestimmt Gesamt-RNA aus aerob und anaerob gewachsenen Zellen von D. ambivalens wurde fUr 
Transkriptionsanaiyse des Ligasegens eingesetzt. Mit einer Ausnahme (RNA aus stationaren Zellen) waren 
die Signale in der Primerextensionsreaktion mit Gesamt-RNA sehr schwach, es war aber aerob wie anaerob 
5 in gleicher Starke nachweisbar. Die Transkription startete auf der ersten Base des ATG-Startcodons der 
Translation, bzw. auf dem vorgelagerten Thymidinrest. Von den ubrigen Leserahmen von pDam-L3 wurde 
kein Startsignal erhalten. 

Die Ergebnisse der Primerextensionsanalyse zeigten eindeutig, dafi das DNA-Ligasegen in vivo transkri- 
biert wird, obwohl die Starke des Signals in der Regel gering und nur in einem Falle mit RNA aus 

70 stationaren Zellen stark war. Die Promotersequenz wies die fur die Archaea typische Struktur mit Box A und 
Box B auf. Uber die ubrigen Leserahmen des Fragmentes konnten keine Aussagen getroffen werden. Die 
Tatsache, daB kein mRNA-Startsignal gefunden wurde, schlieBt nicht aus, daB sie moglicherweise in 
bestimmten Fallen exprimiert werden konnten. 

Die Termination der Transkription wurde durch Sl-Kartierung an derselben RNA- Preparation bestimmt, 

is die auch das starke Initiationssignal lieferte. Die Sequenz, der die Terminationssignale zugeordnet werden 
konnten, lautet ACATTATG, die vorgelagerte Basensequenz lautet AGTAGATGG. Die zugehorige Sequenz 
und die Lage des Signals sind in FIG 6 dargestellt. Die aus den Start- und Terminationssignalen abgeleitete 
Lange des Transkriptes betrug 1908-1914 Nukleotide. 

20 Beispiel 6 



Kreuzhybridisierung mit anderen Spezies 

Genomische DNA aus den folgenden Organismen wurde jeweils doppelt mit Bglll und Ncol verdaut, 

25 sowie zusatzlich mit dem den in Klammern angegebenen Enzymen(en): Archaea: Sulfolobus acidocaldarius 
(EcoRI), S. shibatae (EcoRI), Desulforococcus mucosus (EcoRI), Thermoproteus tenax (Pstl), Thermococcus 
celer (Pstl), Thermoplasma acidophilum (EcoRI), Methanothermus fervidus (EcoRI), Methanococcus vannielii 
(EcoRI) und Haloferax volcanei (Bam Hl/Pstl); Bacteria: Escherichia coli (Hindlll), und Bacillus stearothremo- 
philus (EcoRI); Eucarya: Box primigenius taurus (Rind, EcoRI), und Saccharomyces cervisiae (Backerhefe, 

30 EcoRI). Der Auftrennung der Ansatze auf Agarosegelen folgten ein Southern-Transfer und die Hybridisie- 
rung der Filter mit einem radioaktiv markierten Bglll/Ncol-Fragment aus pDam-L3 (bp 988-2457, FIG 3), 
welches ca. 82 % des Genes enthalt. Die Bedingungen waren: 6 x SSC, 50 % Formamid, Raumtemperatur; 
die Waschbedingungen waren 2 x SSC, Raumtemperatur. Mit in die Auftrennung eingeschlossen wurde 
genomische DNA von D. ambivalens (Bglll/Ncol und EcoRI-geschnitten), sowie das ebenfalls Bglll/Ncol- 

35 geschnittene Plasmid pDam-L3. 

Die Ergebnisse der Hybridisierung zeigen, daB D. ambivalens offenbar nur eine Kopie dieses Genes 
tragi Aufierdem konnten definierte Banden in der DNA von Sulfolobus acidocaldarius und S. shibatae 
nachgewiesen werden, zwei Spezies, die innerhalb der Ordnung der Sulfolobales die am fernsten verwand- 
ten Organismen sind. Bei alien anderen Organismen konnte keine Hybridisierung erzielt werden. Aus diesen 

40 Ergebnissen lafit sich ableiten, daB innerhalb der Sulfolobales offenbar das Gen hoch konserviert ist. 
Daruber hinaus konnte mit dieser Methode auch keine enge Verwandtschaft zu den eukaryalen Enzymen 
auf DNA-Ebene festgestellt werden. 

Zum jetzigen Zeitpunkt umfaBt die Ordnung der Sulfolobales die folgenden Spezies: 
Sulfolobus acidocaldarius 

45 S. solfataricus 
S. shibatae 
S. thuringiensis 
S. metallicus 
Acidianus infernus 

so A. brierleyi 

Desulfurolobus ambivalens 
Stygiolobus azoricus 
Metallosphaera sedula 

Weitere Neuisolate sind zu erwarten. Alle diese Spezies haben eine vergleichbare Morphologie und 
55 Lebensweise und sind auch phylogenetisch verwandt. 
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Beispiel 7 

Expressionsklonierung 

Konstruktion des Expressionsplasmids pQE-L6: Fur die Expression des DNA-Ligase-Genes in E. coli 
wurde aus einer Preparation genomischer DNA mit Hilfe der Polymerase-Kettenreaktion der kodierende 
Bereich des Genes arnplifiziert. Die Oligonukleotide SEQ ID NO 9 und 10 wurden so gestaltet, da8 N- 
terminal eine BamHJ-Schnittstelle gefolgt von einer Schnittstelle der Restriktionsprotease Faktor Xa einge- 
fugt worden war und am C-Terminus eine BamHI-Schnittstelle. Die Amplifikationsbedingungen waren: 
1 x Reaktionspuffer (Boehringer Mannheim, Kat. Nr. 1146165) 
je 100 uM dNTP 
2,5 U Taq-DNA-Polymerase 
je 40 pmol Oligos 
500 ng genom. DNA 



Denaturierung: 


94 




60s 


Anlagerung: 


51 


•c, 


120 s 


Polymerisation: 


72 


'C, 


120 s 


40 Zyklen 



Das Reaktionsprodukt wurde nach Spaltung mit BamHI in den ebenfalls mit BamHI geschnittenen und mit 
alkahscher Phosphatase dephosphorylierten Vektor Quia Express pQE-8 (DIAGEN GmbH, Dusseldorf, BRD) 
ligert. 

Expression in E. coli: Nach Transformation von E. coli wurde eine Vorkultur uber Nacht auf Kanamycin- 
und Ampicillin-haltigem 2 x TY-Medium angezogen. Die daraus angeimpfte Hauptkultur im gleichen Medium 
wurde bis zu einer Zelldichte von OD 60 o = 0,8-1,0 gezogen und dann mit einer IPTG-Konzentration von 2 
mM mduziert. Der zeitliche Verlauf der Proteininduktion wurde uber SDS-Gele verfolgt; in der Regel wurden 
die Zellen 3 h nach Inkubation geerntet. Die Zellen wurden nach Vorbehandlung mit Lysozym aufgeschlos- 
!>c-». indern sie dreimal in flussigem Stickstoff eingefroren und wieder aufgetaut wurden. Die Hitzefallung 
von E coli-Proteinen erfolgte durch funfzehnminutige Inkubatin bei 75 °C und anschliessender Zentrifuga- 
ticm fiii 2 min in der Eppendorfzentrifuge. 

Die PC-Reaktion mit Oligonukleotiden, die eine Amplication des DNA-Ligasegenes unter Einfugung 
e»ner Taktor Xa-Schnittstelle im Protein erlaubten (IEGR), ergab eine einzige scharfe Bande von ca. 1900 bp 
■m Agarosegel. Sie wurde in pQE-8 kloniert, so dafi das Oligopeptid der Sequenz MRGSHHHHHHGSIEGR 
N terminal mit der DNA-Ligase fusioniert wurde. Die [6 x His]-Sequenz soil dabei eine Affinitats-Reinigung 
dec Fusionsproteins uber Nitrilotriessigsaure-cheliertes Nickel ermoglichen. Identifizierung durch Koloniehy- 
bnd.cicrung wurden funf verschiedene positive Klone angezogen, die erhaltenen Plasmide durch Restrik- 
tioncspaltung auf das Vorhandensein eines Fragmentes der erwarteten GroBe untersucht und der Verlauf 
dor Expression nach IPTG-lnduktion im SDS-Gel verfolgt. Vier von den funf Klonen zeigten eine zusatzliche 
Proio nbande mit einem apparenten Molekulargewicht von 65000 im SDS-Gel. Das erwartete Molekularge- 
wicht des Fusionsproteins betrug 69487. Durch eine Hitzebehandlung von Rohlysaten der induzierten Zellen 
konnte ein grofler Teil des Zellproteins abgetrennt werden, wahrend das induzierte Protein loslich blieb. Bei 
dom funften Klon wie auch bei der Vektorkontrolle fehlte die Bande. Es wurde vermutet, dafl der funfte, in 
der Hybridisierung positive Klon das amplifizierte Fragment in inverser Richtung enthielt. 

Bf«i spiel 8 



Retmgung der D. amibvalens-Ligase 

E. coli-Bakterien, welche das Plasmid pQE-L6 enthalten, z.B. M15-pQE-L6, werden in 2 I DYT-Medium 
(J. Sambrook et a!.. Molecular Cloning, 1989, CSH, Vol. 3, Seite A.3) mit 20 ug/ml Ampicillin und 20 ixg/ml 
Kanamycin bei 37 °C angezuchtet. Bei OD550 = 0.8 wird mit 1 mM IPTG induziert und nach 3 Std.- bis 
Ubernacht-lnkubation bei 37 'C geerntet. Die Bakterienzellen werden bei 6000 rpm in 500 ml - Bechern im 
GSA-Rotor einer Sorvall-Zentrifuge pelletiert und in 20 ml Tris, 20 mM, pH 7.6; EDTA, 1 mM und 0- 
Mercaptoathanol, 10 mM resuspendiert. Die Bakterienzellen werden mit Ultraschall-Behandlung aufge- 
schlossen. Dazu werden 4 x 5 ml Aliqouts 5 x 1 Minute bei 50 % der Ausgangsleistung eines Branson 
Sonifier 450 sonifiziert. Danach wird die Suspension bei 39.000 g in einem SS34-Rotor in einer Sorvall- 

9 



0571B80A1_I_> 



EP 0 571 880 A1 



Zentrifuge zentrifugiert und der Uberstand mit 2 M KCI auf eine Salz-Endkonzentration von 300 mM 
gebracht. 

Urn die bakterielle DNA aus dem Ansatz zu reinigen, wird die Losung auf eine DEAE-Saule (5 ml, 
equilibriert mit 300 mM KCI) gebracht und mit 70 ml 300 mM KCI eluiert. Der SaulendurchfluB wird 20'bei 
65 -C behandelt, urn die E. coli Proteine zu denaturieren. Anschliefiend wird im SS34-Rolor bei 18500 rpm 
15 Minuten zentrifugiert und der Uberstand mit gesattigtem Ammoniumsulfat (Volumenverhaltnis 1:1) 
gefallt. Anschliefiend wird erneut bei 18000 rpm zentrifugiert und das Pellet, welches die Ligase aus D. 
sulfurolobus enthalt. in 4 ml H 2 0 aufgenommen. 

Beispiel 9 

Ligationsaktivitat der Desulfurolobus a mbivalens - Ligase 

Als Target fur diesen Aktivitatsnachweis wird genomische DNA des Phagen mit den Restriktionsenzy- 
men Smal (blunt end) und Sail (2 Nukleotide 5'-uberstehende Enden) geschnitten. Bei hoher Reaktionstem- 
peratur sind Hybride dieser Enden nicht stabil, so da6 nur die beiden Endfragmente des Genoms, welche 
kohasive 5'-uberstehende Enden von 12 nt besitzen (sog. cos sites) als Hybrid vorliegen. Dabei liegen in 
diesem Hybrid zwei sogenannte "nicks" in 12 nt Abstand vor. An diesem Template kann demnach die 
Aktivitat einer Ligase an genickter DNA getestet werden: als Produkt entsteht ein Fragment aus den beiden 
eine cos-site enthaltenden genomischen Endfragmenten. 

3 ul der im Beispiel 8 beschriebenen Desulfurolobus ambivalens Ligase-Praparation werden in einem 
Gesamtvolumen von 50 ul in Tris HCI, 20 mM, pH 7.5; MgCI 2 , 10 mM; Dithiothreitol (DTT), 10 mM; ATP, 1 
mM; Polyethylenglycol (PEG), 5% bei 56 -C zwischen 1 Stunde und 12 Stunden inkubiert. Die Reaktions- 
produkte werden in einem 1 % Agarosegel aufgetrennt und mit Ethidiumbromid-Farbung sichtbar gemacht. 

Vorgeschlagene Variationsbreiten fur Ligation: 



Volumen: 


10-200 ul 


Puffer: 


10 - 50 mM 


MgCI 2 : 


2 - 20 mM 


DTT: 


0 - 20 mM 


ATP: 


0.1 mM - 20 mM 


PEG: 


0 - 20% 


Temperatur: 


Raumtemperatur bis 85 °C, Reaktionszeit 10 Min. bis Ubemacht-lnkubation. 



Wird zu der beschriebenen Ligasereaktion zusatzlich Adenosin-5'-0-(3-thiotriphosphat) (ATP-Gamma-S) 
10 mM bzw. 100 mM zugegeben, ist keine Ligation der beiden Lambda-Endfragmente zu sehen. Dies weist 
auf eine deutliche Kompetition des Co-Faktors ATP hin und beweist die ATP-Abhangigkeit der hier 
verwendeten Ligase. 

Beispiel 10 

Vergleichende Cofaktorbestimmung 

Im vorliegenden Beispiel wird ein Versuch beschrieben, mit welchem die ATP-Abhangigkeit der 
erfindungsgemafien Ligase und die Unabhangigkeit von NAD ermittelt wurde. Zum Vergleich wurden die 
Cofaktoren von aus dem Stand der Technik bekannten Ligasen (T4-Ligase, Firma: Boehringer Mannheim 
GmbH) und Thermus spec.-Ligase (Ampligase, Firma: Biozym) ermittelt. 

Zur Cofaktorbestimmung diente die Adenylierungsreaktion. Hierbei wird radioaktiv markierter Cofaktor 
( 32 PATP oder 32 PNAD) in einem Ligationspuffer mit der Ligase inkubiert. Dadurch wird die Radioaktivitat 
durch die Phosphorylierung der Ligase (kovalent) auf das Protein ubertragen. Nach Elektrophorese in einem 
SDS-Gel ist die Ligase durch Autoradiographic sichtbar. 

Verwendet wurden der T4- Ligase- Puffer sowie der Ampligase-Puffer. 

Die Inkubationszeit betrug jeweils 1 Stunde. 

Die Inkubationstemperatur betrug fur die T4-Ligase 37 -C, fur die Ampligase 65 'C und fur die 
Desulforulobus Ligase 45 *C und 65 *C. Verwendet wurden von der T4-Ligase 1 U, von der Ampligase 100 
U und von der Desulforulobus-Ligase 10 bis 1000 ng pro Ansatz. Das Ansatzvolumen betrug 20 ul. Bei 
hoheren Temperaturen wurden die Ansatze mit Ol uberschichtet. 
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T4-Ligase-Puffer: 66 mM Tris/HCI, 5 mM MgCI 2 , 1 mM DTT, pH 7,5 bei 20 °C 
Ampligase-Puffer: 20 mM Tris/HCI, 50 MM KCI, 10 mM MgCI 2 , 1 mM EDTA, 10 mM DTT 

pH 7,6 bei 65 "C 
Radioaktivitat: Amersham 
5 32 PATP, spez. Aktivitat: 15 TBq/mmol, 0,37 MBq Pro Ansatz 

32 PNAD, spez. Aktivitat: 37 TBq/mmol, 0,37 MBq pro Ansatz 
Die Ampligase zeigte wie erwartet die NAD-Abhangigkeit. Die Desulfurolobus-Ligase wird eindeutig durch 
ATP adenyliert. Sie zeigt auch ein schwaches Signal bei NAD als Cofaktor. Dies ist aber auf eine 
Verunreinigung des NAD mit ATP zuruckzufuhren, da auch die T4-Ligase, als eindeutig ATP-abhangiges 
io Enzym, mit NAD ein schwaches Signal erzeugt. 

Der vorstehende Versuch zeigt eindeutig, dafl die erfindungsgemaBe Ligase im Gegensatz zu der aus 
einem thermophilen Eubakterium bekannten Ligase ATP-abhangig ist. 

75 SEJQUENZIROTOKQLL 



(1) ALLGEMETNE INFORMATION: 

(i) ANMELDER: 

(A) NAME: Boehringer Mannheim QnfaH 

(B) STRASSE: Sarrihoferstr. 116 

(C) ORT: Mannheim 

(E) IAND: DE 

(F) FOSTLEITZAHL: 6800 

(G) TELETHON: 0621 759 4348 

(ii) ANMELDETETEL: Thennostabile Ligase aus Archaebakterien 
(iii) ANZAHL DER SBQUENZEN: 14 

(iv) OCMPOTHR-LESBARE FORM: 

(A) DATEMIRAGER: Floppy disk 

(B) OCMPOTER: IBM PC ccnpatible 

(C) BEIRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFIWARE: Patentln Release #1.0, Version #1.25 (EPA) 

(vi) FF&HERE AIMELDEDAIEN: 

(A) ANMEL0ENLM4ER: DE 42 17 134.2 

(B) ANMELDBDATOM: 23-MAY-1992 
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(2) INFORMATION ZU SBQ ID NO: 1: 

(i) SEQUENZ CHARAKTERTSTTKA: 

(A) LANGE: 36 Basenpaare 

(B) ART: Nukleinsaure 

(C) SERANGPOKM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEXULS: DNS (gencmisch) 
(xi) SEQUEN2BESCHREIBUNG: SBQ ID NO: 1 
TATCTNGCNA 1WAATAIGGC NGAAITOAAA AAYGAA 
(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SBQUENZ CHAPAKTEKESTIKA: 

(A) IANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGKXW: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MDLEXULS: CDNS 
(Xi) SBQUENZBESCHRETBUNG: SBQ ID NO: 2 
TOCACrrcCTT CTAGCAACTT 
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(2) INFORMATION ZU SBQ ID NO: 3: 

(i) SBQUENZ CHARAKTERESTIKA: 

(A) IANGE: 20 Basexpaare 

(B) ART: Nukleinsaure 

(C) STEANGTOEM: Einzel 

(D) TOPOIOGIE: linear 

(ii) ART DES MDLEXULS: cDNS 
(xi) SEQUH^ESOiREIBUNG: SBQ ID NO: ' 
GATTAICTAC A33ATAGOCAC 
(2) INHUMATION ZU SBQ ID NO: 4: 

(i) SBQUENZ OmRAKTEKtSnKA: 

(A) I^NGE: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGPORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MDLEXULS: CDNS 
(xi) SBQUENZBESCHREIBUNG: SBQ ID NO: 4 
TAAGTTCAAG OCTAGAA 
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75 



20 



30 



35 



(2) INFORMATION ZU SEQ ID NO: 5: 

(i) SBQUENZ CHARAKTERISTIKA: 

(A) IANGE: 3382 Basenpaare 

(B) ART: NukleiJisaure 

(C) SIRANGFORM: Dappel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEXULS: cDNS 

(ix) MEEKMALE: 

(A) NAME/SCHLUSSEL: pratoter 

(B) IAGE: 878.. 883 



(ix) MEEKMALE: 

(A) NAME/SCHLUSSEL: CDS 
25 (B) IAGE: 908.. 2707 



(ix) MEKKMALE: 

(A) NAME/SCHLDSSEL: terminator 

(B) IAGE: 2713.. 2722 

(D) SONSTIGE ANGABEN: /note= "potentiell" 



(ix) MEKKMALE: 

(A) NAME/SCHLUSSEL: terminator 

(B) IAGE: 2804.. 2811 

40 (D) SONSTIGE ANGABEN: /note= "experimentell" 

(xi) SBQUENZBESCHREIBUNG: SEQ ID NO: 5: 

45 

AAGCTTAAGA ATOCIGACIT A1TCTTTCAA AAAATIGAAA AGCAAGCTQG GAAACTTCTA 60 
TAIACIGADCA AAGAAAGAAT AGCOCTAGAT GTOGATITCT TTAATAA3TT TCTAAAGAAA 120 

50 



55 
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CTTTCAGAIA TICACACITC AGATCATCTA GAAGQGCAAA AAIAOCTCAC TAAGCAAGAA 180 

CAIAAATIAT TCCAAAAATT GAGACAATIG GGAATAAIAT ACTTOGAIAA TAATACTAAG 240 

5 

GCATOGAACT TATOGGAATT TAAATTITGG TAAAGTTAOG OCTTOTICTC CTTOGPflTr 300 

/o GCCATCAIAA GGATTCTCTA CIQOT7ITAA TCTTCTOGCG AAAATCAGGT GAAGAAAGGG 360 

ACTOOOOCTC TTEATCITCA CGQGAAAAGC AGAAOCTACT ACITCTATIG TCAGTK7IOC 420 

TICAAAGOCT GCATCEAOGA TAGTOGGTOG TACAAAAAGA OOCAGOCTGG CAAAAGAAGA 480 

CCirAAGTIG AOGAAAGOCA TTAOGTOGIT OOGCAGTETEA ACATACTCXT CAGTAACIAA 540 

20 

CAGTAGATGT TOGTEAGGCT AAATCATCAA TTCATCPOCT TICTCTATCT CATAAAATCA 600 

AOGOQGGrTCT TITOCATCIT CATATATITC GTCAGTCTIC TEAAAGOGGG CTATCTCTOC 660 

25 

TocTAcrcrr aaatogaooc ogtictctct tatagtatct TGACTAAGAG GAGAGATTAC 720 

^ TATCCAADOC TTTICTAGCT AGTAITITAA ATCTCEA1CT OCAAGAATCA TAAATATCIA 780 

CTA3TTITCA TCITGCAAGA A3ATATTTTA TAAGGAAAAT GGCTTCAGAG TAACXCTGAT 840 

35 ACITCATOCT TCTOGCTIGC OQGTTTICAT CATCAAAIAT ATEATAIOCT AATTCAAACT 900 

TTTATIT ATC GAG TIT AAA ATT ATA GCT GAA TAG TIT GAT AGA CTA GAA 949 
4Q Met Glu Phe Lys lie lie Ala Glu Tyr Phe Asp Arg Leu Glu 

15 10 

AAG ATC TCT TCT AGG CTT CAA CIT ACA TCA TEA CTT GCA GAT CTT TTT 997 
45 Lys lie Ser Ser Arg Leu Gin Leu Thr Ser Leu Leu Ala Asp Leu Fhe 
15 20 25 30 

50 
55 
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w 



AAG AAA ACT GAG AAA AAT GTT AIT GAT AAA GIT CTA TAT ATA ATT GAG 1045 
Lys Lys Thr Asp Lys Asn Val He Asp Lys Val Val Tyr He He Gin 
35 40 45 

GCT AAA CTA TOG OCA GAC TTC TEA GGA AUG OCA GAA TEA GGA ATA OCT 1093 
Gly Lys Leu Trp Pro Asp Fhe Leu Gly Met Pro Glu Leu Gly He Gly 
50 55 60 

GAA AAA TTC CIT ATA AGA GCA TEA TCA ATA GCT ACA PGC GTA AGC GAT 1141 
Glu Lys Phe Lai He Arg Ala Lai Ser He Ala Thr Ser Val Ser Asp 

65 70 75 

GAT GAA ATA GAA AAA ATC TAT AAA TCA GTA GGA GAT TTC GGG GAA GTA 1189 
Asp Glu He Glu Lys Met Tyr Lys Ser Val Gly Asp Lai Gly Gin Val 
80 85 90 

25 GCT TTT GAT ATA AAG CAA AAA CAG CAG TCT GCC ACT ATT TEA GOG TTT 1237 

Ala Phe Asp He Lys Gin Lys Gin Gin Ser Ala Ser He Lai Ala Phe 
95 100 105 110 



75 



20 



30 



35 



40 



TEA GGA GOG CAA AAA GCT TCA AAG GOG CEA ACT CTA GAA AAA GIT TAT 1285 
leu Gly Ala Gin Lys Ala Ser Lys Pro Lai Thr Val Glu Lys Val Tyr 
115 120 125 

GAT GAT TEA GCA AAA CTE GCT ACA AGC ACT GGA GAA GGT ACT AGA GAT 1333 
Asp Asp Leu Ala Lys Val Ala Thr Ser Thr Gly Glu Gly Ser Arg Asp 
130 135 140 



ATT AAA ATC AGA CIA TEA GCA GGA TEA CIT AAG GAT GCT TCT OCA CTE 1381 
He Lys He Arg Leu Lai Ala Gly Lai Leu Lys Asp Ala Ser Pro Leu 

45 145 150 155 

GAG GCT AAA TAT TEA GTE AGA TIT GIT GAT GGT AGG TEA AGG GTT GGA 1429 
so Glu Ala Lys Tyr Lai Val Arg Phe Val Asp Gly Arg Lai Arg Val Gly 

160 165 170 



55 
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ATA GGA GAC GCE ACA ATA TEA GAC GCA CIA GCA AHA ACT TEC QGC GGC 1477 
lie Gly Asp Ala Thr lie Lai A^> Ala Leu Ala He Thr Phe Gly Gly 
175 180 185 190 



GGG CAG AAC TIT AGG OCT ATA GIT GAA AGA GCA TAC AAT TIG AGG GOC 1525 
Gly Gin Asn Fte Arg Pro He Val Glu Arg Ala Tyr Asn Lai Arg Ala 
195 200 205 

GAT TEA GCT AAT AIT GCA AAA ATA TEA GCA AAT GGC GGA ATT GAA CAA 1573 
Asp Leu Gly Asn He Ala Lys He Lai Ala Asn Gly Gly lie Glu Gin 
210 215 220 

CEG AAG AAC ATE AAA OCT CAG CCA GGG ATT CCA ATA AGG CCA AIG CEA 1621 
leu Lys Asn He Lys Pro Gin Pro Gly He Pro He Arg Pro Met Lai 
225 230 235 

GCT GAA AGA TEA TCA GAC OCT GCA GAG AIG TEA ACT AAG GEA GGC AAT 1669 
Ala Glu Arg Lai Ser Asp Pro Ala Glu Met Lai Ser Lys Val Gly Asn 
240 245 250 

ATT GCA TEG GEC GAT TAT AAG TAT GAT GGA GAG AGA GGA CAA AIT CAT 1717 
He Ala Lai Val Asp Tyr lys Tyr Asp Gly Glu Arg Gly Gin He His 
255 260 265 270 



AAA GCA GGA GAT AAA ATE TTC ATA TTC TCE AGA AGA TIG GAA AAT ATA 1765 
Lys Ala Gly Asp Lys He Phe He Phe Ser Arg Arg Lai Glu Asn He 
275 280 285 



ACA AAT CAA TAT OCT GAC GTA GCA GAG TAT ATE TCA AAA TAC GTE AAA 1813 
Thr Asn Gin Tyr Pro Asp Val Ala Glu Tyr He Ser Lys Tyr Val Lys 
290 295 300 



50 



55 



17 



BNSDOCID: <EP 0571880A1 J_> 



EP 0 571 880 A1 



70 



75 



GGT AAT GAG TTC ATA CTT GAG GGA GAA ATA ATA OCA GTA GAT OCA GAA 1861 
Gly Asn Glu Phe He Val Glu Gly Glu He He Pro Val Asp Pro Glu 
305 310 315 

ACT GGT GAA ATC AGA OCT TTC GAA GAA TIG AUG CAC AGG AAA AGG AAG 1909 
Thr Gly Glu Met Arg Pro Phe Gin Glu Leu Met His Arg Lys Arg Lys 
320 325 330 

T0C GAT AIT CAC GAG GCT ATA AAA GAG TAT O0G GIT AAC GEA TTC TEA 1957 
Ser Asp He His Glu Ala He Lys Glu Tyr Pro Val Asn Val Ete Leu 
335 340 345 350 

TTT GAT TEA ATC TAG TAT GAA GGA GAA GAT TAT AGA GTA AAG 00G TEA 2005 
Phe Asp Leu Met Tyr Tyr Glu Gly Glu Asp Tyr Thr Val Lys Pro Leu 
355 360 365 

TCA GAA AGA OCT AAG AAG TEA GAA TCA ATA GTT GAA GAT AAC GAT TAT 2053 
Ser Glu Arg Arg Lys Lys Lai Glu Ser He Val Glu Asp Asn Asp Tyr 
370 375 380 

30 GTA CAT ATA GOC ACT CAT ATT ATA ACT GAT AAT GEA. GAA AAA CEA AAG 2101 

Val His He Ala Thr His He He Thr Asp Asn Val Glu Lys Leu Lys 
385 390 395 



20 



25 



35 



40 



45 



GAA TTC TTC TAT CAA GCA ATC TCE GAA GGC GCA GAA GGC GEA ATG GEA 2149 
Glu Phe Phe Tyr Gin Ala He Ser Glu Gly Ala Glu Gly Val Met Val 
400 405 410 

AAA TCE CIG GCA OCA GAT GCA ATA TAT CAA GCA GGA TCA AGA GCT TOG 2197 
Lys Ser Leu Ala Pro Asp Ala He Tyr Gin Ala Gly Ser Arg Gly Tip 
415 420 425 430 



50 



55 
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CTT TCG ATA AAG TTE AAG AGA GAT TAC CAG AGC GAA ATC GCA GAT ACT 2245 
Leu Trp He Lys Phe Lys Arg Asp Tyr Gin Ser Glu Met Ala Asp Thr 
435 440 445 

GEA GAG CIG GTA ATC GTA GGT GCT TTT GAC GGT AAA GGA AGG AAA GGA 2293 
Val Asp Leu Val Met Val Gly Ala Phe His Gly Lys Gly Arg Lys Gly 
450 455 460 



GGC AAA TAT AGE TOC TTC TEA ATC GCT GCA TAT AAT OCA GAC AAG GAC 2341 
Gly Lys Tyr Ser Ser Phe Lai Met Ala Ala Tyr Asn Pro Asp lys Asp 
465 470 475 

GIT TTC GAG ACT GTA TCT AAA GIT GCT TCT GGT TTT ACT GAT GCA GAA 2389 
Val Phe Glu Thr Val Cys Lys Val Ala Ser Gly Phe Thr Asp Ala Glu 
480 485 490 



CTT GAC GAT TEA CAG AAG AAA ATT GOC GAG TEA AAA AGA GAC ACA OCT 2437 
Lai Asp Asp Leu Gin Lys Lys He Ala Glu Leu Lys Arg Asp Thr Pro 
495 500 505 510 

30 CAT OCA AGA GTE GEA TCA AOC ATC GTE OCA GAT GTE TOG TEA ACA OCA 2485 
His Pro Arg Val Val Ser Thr Met Val Pro Asp Val Trp Lai Thr Pro 
515 520 525 

35 

GCA CTT GTE GOC GAA ATA ATT GGA GCA GAA ATA ACE ATA TCT OCT CEA 2533 
Ala Lai Val Ala Glu He He Gly Ala Glu He Thr He Ser Pro Lai 
530 535 540 

40 

CAT ACT TCT TCC AAA GAT CAG TAT GCA GAA GCT GGT TEA TCA ATA AGA 2581 
His Thr Cys Cys Lys Asp Gin Tyr Ala Glu Gly Gly Lai Ser He Arg 
545 550 555 



50 
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TTC OCA AGA TIT ATA AGG TOG AGA OCA GAT AAG AGT OCA GAA GAT GCA 2629 
Phe Pro Arg Phe lie Arg Trp Arg Pro Asp Lys Ser Pro Glu Asp Ala 
560 565 570 

ACT ACT AAT OCT GAA ATT CTT GAG ATG TAT AAG AGO GAA TEA AAG AAG 2677 
Itir Thr Asn Arg Glu He Leu Glu Met Tyr lys Ser Gin Lai Lys Lys 
575 580 585 590 

ATT GAA GAA AAG O0G TCA GAT GAG AGT GEA TAAGTTTITA TAAAATAACT 2727 
He Glu Glu Lys Pro Ser Asp Gin Ser Val 
595 600 

CATAGTTATC TITTOICTIC TTOGATATEA AGAAGTCTGG TGCAATACTT TEAGGEAACA 2787 

ACTTEACAGT AGATGGACAT TATGAGOGAA ATTTTAGGCT TGTEAACTCAT TTTCATGCTG 2847 

AOCATATTTT GCAATIAAAT AAGAGOGTAT CATCTTCEAT TOGGATEATA TCAACTOCTC 2907 

CAACICITCA AGTTCTCTCA GETTEAGGCT ATGATATAOC TAAGAAAAAA GCAATGGGAA 2967 

TAAGTEATQG TCEAAAAATE GCAATAGAAG ATGAGAAAAT AGAACTAGIT CAGGCAGATC 3027 

ATGrEATITGG AGOOGCTCAA GTAGTJOEAA CAAATTOCAA TCGOGAAAGT GEAGGTEATA 3087 

CIGGAGATTE TAAGAATCGG GGTAAAGGTA CTOCTATACT TAATACTGAC GEATEAATIG 3147 

TTGATACTAC CIAOGGAAAG OOGACATTEA GAAGAAAATT TAGAGAIGAA GITCAAGTCE 3207 

TATITICAGA TTAOGTAAAC GATTCATEAA TTTATQGAOC AGEAAGAGTT TAIGCTTACT 3267 

ATGGAAAGAT TCAAGAGGCA ATGAAAAIAC TGAGGAAAAA TGGAATITOS GOOOCTITEA 3327 

TAGEAGATQG TAAAAXAAAA GAAGTEACAG ATATIGCAAT AAAGEATQGE CEAGA 3382 
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(2) INFORMATION ZU SBQ ID NO: 6: 

(i) SBQUENZ CHARAKTERISTIKA: 

(A) lANGE: 600 Aminosauren 

(B) ART: Aminosaure 
(D) TDPOIDGIE: linear 

(ii) ART DES MDLEKULS: Protein 

(xi) SBQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Glu Phe Lys He He Ala Glu Tyr Phe Asp Arg Lai Glu Lys He 
15 10 15 

Ser Ser Arg Lai Gin Lai Thr Ser Lai Lai Ala Asp Leu Phe Lys Lys 
20 25 30 

Thr Asp Lys Asn Val He Asp Lys Val Val Tyr He He Gin Gly Lys 
35 40 45 

Lai Trp Pro Asp Phe Lai Gly Met Pro Glu Lai Gly He Gly Glu Lys 
50 55 60 

Phe Leu He Arg Ala Lai Ser He Ala Thr Ser Val Ser Asp Asp Glu 
65 70 75 80 

He Glu Lys Met Tyr Lys Ser Val Gly Asp Lai Gly Gin Val Ala Phe 
85 90 95 

Asp He Lys Gin Lys Gin Gin Ser Ala Ser He Lai Ala Phe Lai Gly 
100 105 110 
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Ala Gin Lys Ala Ser Lys Pro Leu Thr Val Glu Lys Val Tyr Asp Asp 
115 120 125 

Leu Ala Lys Val Ala Thr Ser Thr Gly Glu Gly Ser Arg Asp lie Lys 
130 135 140 

He Arg Leu Leu Ala Gly Leu Leu Lys Asp Ala Ser Pro Leu Glu Ala 
145 150 155 160 

Lys Tyr Leu Val Arg Phe Val Asp Gly Arg Leu Arg Val Gly He Gly 
165 170 175 

Asp Ala Thr He Leu Asp Ala Leu Ala lie Thr Phe Gly Gly Gly Gin 
180 185 190 

Asn Phe Arg Pro He Val Glu Arg Ala Tyr Asn Leu Arg Ala Asp Leu 
195 200 205 

Gly Asn He Ala Lys He Leu Ala Asn Gly Gly He Glu Gin Leu Li's 
210 215 220 

Asn He Lys Pro Gin Pro Gly He Pro He Arg Pro Met Leu Ala Glu 
225 230 235 240 

Arg Leu Ser Asp Pro Ala Glu Met Leu Ser Lys Val Gly Asn He Ala 
245 250 255 

Leu Val Asp Tyr Lys Tyr Asp Gly Glu Arg Gly Gin He His Lys Ala 
260 265 270 



Gly Asp Lys He Phe He Phe Ser Arg Arg Leu Glu Asn He Thr Asn 
275 280 285 
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Gin Tyr Pro Asp Val Ala Glu iyr lie Ser Lys Tyr Val Lys Gly Asn 
290 295 300 

Glu Phe He Val Glu Gly Glu lie He Pro Val Asp Pro Glu Thr Gly 
305 310 315 320 

Glu Met Arg Pro Phe Gin Glu Leu Met His Arg lys Arg Lys Ser Asp 
325 330 335 

He His Glu Ala He Lys Glu Tyr Pro Val Asn Val Phe Lai Phe Asp 
340 345 350 

Lax Met Tyr Tyr Glu Gly Glu Asp Tyr Thr Val Lys Pro Leu Ser Glu 
355 360 365 

Arg Arg Lys Lys Leu Glu Ser He Val Glu Asp Asn Asp Tyr Val His 
370 375 380 

He Ala Thr "is He He Thr Asp Asn Val Glu Lys Lai Lys Glu Phe 
385 390 395 400 

Phe Tyr Gin Ala He Ser Glu Gly Ala Glu Gly Val Met Val Lys Ser 
405 410 415 

Leu Ala Pro Asp Ala He Tyr Gin Ala Gly Ser Arg Gly Trp Leu Trp 
420 425 430 

He Lys Phe Lys Arg Asp Tyr Gin Ser Glu Met Ala Asp Thr Val Asp 
435 440 445 

Leu Val Met Val Gly Ala Phe His Gly Lys Gly Arg Lys Gly Gly Lys 
450 455 460 
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Tyr Ser Ser Phe Leu Met Ala Ala Tyr Asn Pro Asp Lys Asp Val Phe 
465 470 475 480 

Glu Thr Val Cys Lys Val Ala Ser Gly Phe Thr Asp Ala Glu Lai Asp 
485 490 495 

Asp Leu Gin Lys lys He Ala Glu Leu Lys Arg Asp Thr Pro His Pro 
500 505 510 

Arg Val Val Ser Thr Met Val Pro Asp Val Trp Leu Thr Pro Ala Lai 
515 520 525 

Val Ala Glu He He Gly Ala Glu He Thr He Ser Pro Leu His Thr 
530 535 540 

cys Cys Lys Asp Gin Tyr Ala Glu Gly Gly Lai Ser He Arg Phe Pro 
545 550 555 560 

Arg Phe He Arg Trp Arg Pro Asp Lys Ser Pro Glu Asp Ala Thr Thr 
565 570 575 

Asn Arg Glu He Leu Glu Met Tyr Lys Ser Gin Leu Lys Lys He Glu 
580 585 590 

Glu Lys Pro Ser Asp Gin Ser Val 
595 600 
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(2) INHUMATION ZU SBQ ID NO: 7: 

(i) SBQUENZ CHARAKTERIOTIKA: 

(A) LANGE: 17 Basenpaare 

(B) ART: NukJLeinsaure 

(C) STOANGFQfW: Einzel 

(D) TOPODDGIE: linear 

(ii) APT DES M3LEKULS: cDNS 

(xi) SBQUENZBESCHRETBUNG: SBQ ID NO: 7: 

actttogcca ttcgaat 

(2) INFORMATION ZU SBQ ID NO: 8: 

(i) SBQUENZ CHARAKTERISTTKA: 

(A) IANGE: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGPQBM: Einzel 

(D) TOPODDGIE: linear 

(ii) ART DES MDLEXtiLS: cCNS 
(xi) SBQUENZBESCHREEBUNG: SEQ ID NO: 8: 
CTCITAAATC GAOOOOG 
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(2) INFORMATION ZU SBQ ID NO: 9: 

(i) SBQUENZ CHARAKTERISITKA: 

(A) LANGE: 38 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) APT DES MDLEKtJLS: cDNS 

(xi) SB2UENZBESCHREIHJNG: SBQ ID NO: 9: 
GCGGATOCAT OGAAGCTAGA ATQGACTTTA AAATIATA 
(2) INFORMATION ZU SBQ ID NO: 10: 

(i) SBQUENZ CHARAKTERISTIKA: 

(A) IANGE: 30 Basenpaare 

(B) ART: Nukleinsaure 

(C) STOANGFORM: Einzel 

(D) TOPOIOGIE: linear 

(ii) ART DES MDUKtJLS: cDNS 
(xi) SBQUENZBESCHREIBUNG: SBQ ID NO: 10: 
TATGGATOCT TATACACTCT GATCTGAOQG 
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(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SBQUENZ CHARAKTERISriKA: 

(A) lANGE: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFOHM: Einzel 

(D) TOPOUDGIE: linear 

(ii) ART DES MDLEXULS: CDNS 

(xi) SBQUEKZBESCHREIBUNG: SBQ ID NO: 11: 
GITITOOCAG TCAOGAC 
(2) INFORMATION ZU SBQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 18 Basenpaare 

(B) ART: Nukleinsaure 

(C) STOANGPQFM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MDLEXOLS: cCNS 
(xi) SBQUtNZBESCHREEBUNG: SBQ ID NO: 12: 
CACACAGGAA ACAGCIAT 
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20 



25 



30 



(2) INFORMATION ZU SEQ ID NO: 13: 

(i) SBQgiNZ CHARAKTHRISTIKA: 

(A) iAlGE: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STOANGFQRM: Einzel 

(D) TOPQDOGIE: linear 

(ii) AFT DES MDIJEXULS: cCNS 
(Xi) SEQUENZBESCHREIBUNG: SBQ ID NO: 13: 
AITAAOOCIC ACTAAAG 17 
(2) HMHCKMAnON ZU SBQ ID NO: 14: 

(i) SBKJENZ CHARAKTERISTTKA: 

(A) LANGE: 17 Basenpaare 

(B) AFT: NukleinsMure 

(C) STOANGTORM: Einzel 

(D) TOPQDOGIE: linear 

(ii) AFT DES MDLE3CULS: cDNS 
(xi) SBQUENZBESCHRETBUNG : SBQ ID NO: 14: 
AATAOGACTC ACEATAG 17 

Patentansprtiche 

1. Thermostabile Ligase erhaltlich aus Bakterien der Gruppe der Archaebakterien. 

45 

2. Ligase gemaB Anspruch 1, erhaltlich aus Bakterien der Ordnung der Sulfolobales. 

3. Ligase enthaltend 

- die Aminosauresequenz der FIG 1 Oder 

50 ' einen Tei! der Aminosauresequenz der FIG 1 mit mehr als 50 Aminosauren Lange, der 

Ligaseaktivitat aufweist, Oder 

- eine Aminosauresequenz, die mindestens zu 40 % homolog zu einer der genannten Sequenzen 
ist und Ligaseaktivitat aufweist. 

55 4. Ligase gemaB Anspruch 1 , dadurch gekennzeichnet, daB sie ATP-abhangig ist. 

5. Ligase gemaB Anspruch 1, dadurch gekennzeichnet, daB sie weniger als 36 % Hornologie zu der 
Aminosauresequenz von eukaryonten DNA-Ligasen aufweist. 

28 
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6. Ligase gemaB Anspruch 3, mit einem Molekulargewicht von ca. 67.6 kD. 

7. Ligase gemaB einem der vorangehenden Anspruche, dadurch gekennzeichnet, dafi sie rekomblnant 
hergestellt ist. 

8. Ligase gemaB Anspruch 2, erhaltlich aus Desulfurolobus ambivalens. 



9. Thermostabile DNA-Ligase, erhaltlich aus dem Expressionstamm mit der Hinterlegungsnummer DSM 
7070. 

10. Nukleinsauresequenz, kodierend fur eine thermostabile Ligase aus Archaebakterien. 

11. Nukleinsauresequenz nach Anspruch 10, enthaltend 

- die Nukleotidsequenz der FIG 1 oder 

- einen Teil davon, der fur eine Ligase kodiert und mindestens 150 bp lang ist, oder 

- eine Sequenz, die mindestens zu 40 % homolog zu einer der genannten Sequenzen ist und fur 
eine Ligase kodiert. 

12. Nukleinsauresequenz, deren Komplernent unter stringenten Bedingungen mit der Nukleinsaure nach 
FIG 1 hybridisiert. 

13. Nukleinsauresequenz nach Anspruch 12, deren Komplernent unter stringenten Bedingungen mit dem 
3382 bp langen Xbal/Hind Ill-Fragment aus Desulfurolobus ambivalens hybridisiert. 

14. Nukleotidsequenz von mindestens 150 Nukleotiden Lange, enthalten in oder komplementar zu dem 
1800 bp langen BamHI-Fragment aus DSM 7070. 

15. Verfahren zum Nachweis einer Nukleinsaure durch Hybridisierung zweier Oligonukleotide mit benach- 
barten Sequenzen der Nukleinsaure, Ligation und Nachweis des Ligationsproduktes, dadurch gekenn- 
zeichnet, daB die Ligation von der Ligase gemaB Anspruch 1 mit ATP als Cofaktor vorgenommen wird. 

16. Expressionsclon M15-pQE-L6 mit der Hinterlegungsnummer DSM 7070. 
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FIG. 1a 
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- AAGCTTAAGAATCCTGACTTATTCTTTGAAAAAATTGAAAAGCAAGGTGGGAAAGTTCTA - 60 
KLKNPDLFFEKIEKQGGKVL 

- TATACTGATAAAGAAAGAATAGCCGTAGATGTCGATTTCTTTAATAATTTTGTAAAGAAA - 120 
YTDKERIAVDVDFFNNFVKK 

- CTTTCAGATATTCACACTTCAGATGATGTAGAAGCGCAAAAATACCTCACTAAGCAAGAA - 180 
LSD I HTSDDVEAQKY LTKQE 

• CATAAATTATTCCAAAAATTGAGACAATTGGGAATAATATACTTCGATAATAATACTAAG - 240 
HKLFQKLRQLG IIYFDNNTK 

• GCATGGAAGTTATCGGAATTTAAATTTTGGTAAAGTTACGCCTTGTTGTCCTTGGTATTT - 300 
AWKLSEFKFW* Enda von pDam-L3-ORF4 

* RFKFKP L T V GQQGQYK 

• GCCATGATAAGGATTCTCTACTGGTGTTAATGTTCTGGCGAAAATGAGGTGAAGAAAGCG - -60 

GHYP NEVPTLTRAF ILHLFR 
■ AGTCCCCCTCTTTATCTTCACGGGAAAAGCAGAACCTAGTACTTCTATTGTGAGTTGTCC - 420 
TGRK I KVPFASGLVE ITLQG 
TTCAAAGCCTGCATCTACGATAGTCGGTGGTACAAAAAGACCCAGCCTGGCAAAAGAAGA - 480 

EFGADVITP PVFLGLRAFSS 
CCTTAAGTTGACGAAAGCCATTACGTCGTTCGGCAGTTTAACATACTCCTCAGTAACTAA - 540 

RLNVFAMVDNPLKVYEETVL 
CAGTACATGTTCGTTAGGGTAAATGATGAATTCATCTCCTTTCTCTATCTCATAAAATGA - 600 

LVHENPYIIFEDGKE IEYFS 
ACGCGGGTCTTTTCCATCTTCATATATTTCGTCAGTCTTCTTAAAGCGGGCTATCTCTCC - 660 

RPDKGDEYIEDTKKFRAIEG 
TCCTACTCTTAAATCGACCCCGTTCTCTCTTATAGTATCTTGAGTAAGAGGAGAGATTAC - 720 

GVRLDVGNERITDQTLPSIV 
TATCCAACCCTTTTCTAGGTAGTATTTTAAATCTCTATCTCCAAGAATCATAAATATCTA - 780 
IWGKELYYKLDRDGLIMf- pDam-L3 -ORF3 
CTATTTTTCATCTTGCAAGAATATATTTTATAAGGAAAATGGCTTCAGAGTAACTCTGAT - 840 
ACTTCATCCTTCTGGCTTGCCGGTTTTCATCATCAAA1MA1XATATCGTAATTCAAACT - 900 
TTTATTTATGGAGTTTAAAATTATAGCTGAATACTTTGATAGACTAGAAAAGATCTCTTC - 960 
Ixg — >MEFKIIAEYFDRLEKISS 
TAGGCTTCAACTTACATCATTACTTGCAGATCTTTTTAAGAAAACTGACAAAAATGTTAT - 1020 

R LQLTSLLADLFKKTDKNVI 
TGATAAAGTTGTATATATAATTCAGGGTAAACTATGGCCAGACTTCTTAGGAATGCCAGA - 1080 

DKVVY I IQGKLWPDF LGMPE 
ATTAGGAATAGGTGAAAAATTCCTTATAAGAGCATTATCAATAGCTACAAGCGTAAGCGA - 1140 

LGIGEKFLIRALS IATSVSD 
TGATGAAATAGAAAAAATGTATAAATCAGTAGGAGATTTGGGGCAAGTAGCTTTTGATAT - 1200 

DEIEKMYKSVGDLGQVAFDI 
AAAGCAAAAACAGCAGTCTGCCAGTATTTTAGCGTTTTTAGGAGCGCAAAAAGCTTCAAA - 1260 

KQKQQSASILAFLGAQKASK 
GCCGCTAACTGTAGAAAAAGTTTATGATGATTTAGCAAAAGTTGCTACAAGCACTGGAGA - 1320 

PLTVEKVYDDLAKVATSTGE 
AGGTAGTAGAGATATTAAAATCAGACTATTAGCAGGATTACTTAAGGATGCTTCTCCACT - 1380 

G SRD IKIRLLAGLLKDASPL 
TGAGGCTAAATATTTAGTTAGATTTGTTGATGGTAGGTTAAGGGTTGGAATAGGAGACGC - 1440 

EAKYLVRFVDGRLRVGIGDA 
TACAATATTAGACGCACTAGCAATAACTTTCGGCGGCGGGCAGAACTTTAGGCCTATAGT - 1500 

TILDALAITFGGGQNFRPIV 
TGAAAGAGCATACAATTTGAGGGCCGATTTAGGTAATATTGCAAAAATATTAGCAAATGG - 1560 

E R A Y N L R A D L G N I A K I L A N G 
CGGAATTGAACAACTGAAGAACATTAAACCTCAGCCAGGGATTCCAATAAGGCCAATGCT - 1620 

GIEQLKNIKPQPGIP IR PML 
AGCTGAAAGATTATCAGACCCTGCAGAGATGTTAAGTAAGGTAGGCAATATTGCATTGGT - 1680 
AERLSDPAEMLSKVGNIALV 
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FIG. 1b 
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2401 - ACAGAAGAAAATTrcCGAGTTAAAAAGAGACACACCTCATCCAAGAG - 2460 
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ATTCCAATGGCGAAAGTGTAGGTTATACTGGAGATTTTAAGAATCCGGGTAAAGGTACTC - 3120 
iNGESVGYTGDFKNPGKrTD 

CTATACTTAATACTGACGTAPAATTGTTGATACTACCTACGGAAAGCCGACATTtLa^ - 3180 
iLNTDVLlVDTTYGKPTrpp 
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3301 - GGAAAAATGGAATTTCGGCCCCT™^ - 3360 

3361 - TTGCAATAAAGTATGGTCTAGA AVU ^KIKEVTDI 
A I K Y G L — » 
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FIG. 4a 



H. sap, 



H. sap. 
5. cer. 
S . pom . 
Kon3 



H. sap. 
S. cer. 
S. pom. 
Kon3 . 



H. sap. 
S. cer. 
S. pom. 
Kons . 



S. tau, 
D. amb. 
H. sap. 
S. cer. 
S. pom. 
Vacc. 
Kons . 



1 60 
MQRSIMSFFH PKKEGKAKKP EKEASNSSRE TEPPPKAALK EWNGWSESD SPVKRPGRKA 



D. amb . 
H. sap. 
S. cer. 
5. pom. 
Vacc. 
Kons . 



D. amb, 
H. sap. 
S. cer. 
S. pom. 
vacc. 
T4 

Kons . 



D. amb. 
H. sap. 
S. cer. 
S. pom. 
Vacc . 
T4 

Kons . 



0 . amb. 
H. sap. 
S. cer. 
S. pom. 
Vacc . 
T4 

Kons . 



61 

ARVLGSEGEE EDEALSPAKG QKPALDCSQV SPPRPATSPE 

MRRLLTGC . . LLSSARPL 

MRTVFSQI PRFKQVNQYI 

mr sq p 

121 

PKRRTARKQL PKRTIQEVLE EQSEDEOREA KRKKEEEEEE 

PKQATL 

SEHVEV 

Pk t 

181 

DQPTTPPKPL KTSKAETPTE SVS.EPEVAT KQELQEEEEQ 
gGTPSPKKSS KHML.EERMD NVSGEEEYAT KKLKQTAVTH 
RSTSEKRKVE SVKLVDESKH N..NHDDTGT QNVERE..NN 
t p K Jc 1 ee nvs e e aT k. q 

241 



*Y5KXfSfS PGAPGKEGAA EGPLDPSGYN PAKNNYHPVE 
APSSGVADSP QQSQRLVGEV EDALSS...N M.NDHYSSN. 
DAVSSNNDSG ASTPIPLPIK EPPLES...N ARNDKXKGH . 



a 3 vda 
301 

RLEK I SSRLQ 
KISEVSARLR 
KIEAISSRLE 
KIENTSKRLE 
DIYHASGYKE 
kie S rle 

361 

ALSIATSVSD 
AVAQATGROL 
TISETCGKSM 
AIGESTGOTL 
LYSIIFKQSQ 



P 



E pL 3 



LTSLLADLFK KTDKNVIDKV 
MVETLSNLLR SWALSPPDL 
IIRICSDFFI KIMKQSSKNV 
IIDIMGTYFF GILRDHPSDL 
KSKLIRDFIT DRDDK 



nd y 



V. . . YIIQGK 
LPVLYLSLNH 
IPTTYI^INR 
LACVYLSINK 

YLIIKL 

YL in 



120 

NNASL. SDTS P.MDSSPSGI 
. KSRLPLLttS SSLPSSAGKK 
RMSTRQSDIS NFFISSASHK 
s 1 sd S SSas Jc 

180 

TPKESLTEAE VATEKEGEDG 

AR FFTSMKNKPT 

SQ SSSDSKNVDG 

a t lendg 

240 

TKPPRRAPKT LSSFFTPRKP 
TVAAPSSMGS NFS . . SIPSS 
IVSEAKKQKT LGS..SSSSS 
tv t 1 5 3 S3 

300 

V PTLAVAR 

M EFKIIAEYFD 

DACWKPGQKV PYLAVARTFE 

I PYSEVCEVFN 

A TFAEMVKAFT 

MT SLREFRKLCC 

e f 



LWPOFLGMPE 
LGPP . QQGLE 
LGPDY EAGLE 
LGPDY . SGLE 
LLPGLDDRI . 
LgPd le 



360 

LGIGEKFLIR 
LGVGDGVLLK 
LGLGENLLMK 
LGIGESIIMK 
YNMNDKQIIK 
lg ge i k 



DEIEKMYKSV GDLGQVAFDI KQKQQSASIL 
ESVRAEAAEK GDVGLVAENS RSTQRLMLP . 
5QIKLKYKOI GDLGEIAMGA RNVQPTMFK. 
QQIKLSFHKV GDLGLVAQTS RQNQPTMFK. 
EDM L QDUGYGYIG. . DTIRTFFKE 



gDIG va 



421 

LAKVATSTGE 
FRDIARLTGS 
LRAIAKTQGK 
LKKIAQMSGN 
LTTLSSVTKE 
IGSTKQKQAI 
1 ia tg 

481 

. . . GGGQNFR 
SLTPPGQEFP 
LLHDENRE . . 
AQYHADKN. . 

Y 

FIEFTLAT . . 



GSRDIKIRLL 
ASTAKKIDII 
DSQLKKMKLI 
QSQNRKIGVI 
SHQ. . . XKLL 
LEKNKDNELL 
sq kki 1* 



AGLLKDASPL 
KGLFVACRHS 
KRMLTACKGI 
KRLLSSCEGA 
TOIASVCTCN 
KRVYRLTYSR 
*rll c 



q mfk 



EAKYLVRFVD 
EARFIARSLS 
EAKFLIRSLE 
EPKYLIRALE 
DLKCWMLID 
GLQYYIKKWP 
eakylxr 



420 

AFLGAQKASK PLTVEKVYDD 

PP PLrASGVFSK 

PK PLTVGEVFKN 

PA ALTIPFLFDS 

NTEIRPRDKS ILTLEDVDSF 

M ILKILNEIAS 

p pLt vf 



GRLRVGIGDA 
GRLRLGLAEQ 
SKLRIGLAEK 
GKLRLQLAEK 
KDLKIKAGPR 
. KPGIATQSF 
Jclriglae 



480 

TILDALAITF 
SVLAALSQAV 
TVLISLSKAL 
TILVALANAT 
YVLNAISPNA 
GMLTLTDMLD 
tvL als a 



pAmvdagkgk taearktwle eqgmilkqtf :::?^SgS 

DSP DKOVPMOVLE SAQQKXRDAF CQVPNYEIVI . . . NSCLEHG 

G EKLSQQDRIE GEQ.ILRDVY CQLPSYDLIV . . . PHLIEHG 

.......DVF RKSNNLKEII ENASKQNLDS 

RKLTGNAAIE ELTGYITDG. .KKDDVEVLR RVHMRDLECG 

e i d f c pdl ii llehg 



0571B80A1_I_> 



33 



EP 0 571 880 A1 



3. C2U. 

D . a.-no . 
H. sap. 
5. cer. 
S . pom . 
Vacc . 
T4 
T3 
T7 

Kons . 



D. amb. 
H. sap. 
5. cer. 
S. pom. 
Vacc . 
T4 
T3 
T7 

Kons . 



D. amp. 

H. sap. 

S. cer. 

S. pom. 

vacc. 

T4 

T6 

T3 

T? 

Kons . 



541 

IEQLKNI .KP 
LERLPEHCKL 
IMNLDKYCTL 
LGTLRETCKL 
I.SISVM. . . 
A.SVSIANKV 



i 1 Ckl 
601 

KAGDKIFIFS 
LEGGEVKIFS 
LNDGTMRIYS 
TEDGKFYVFS 
KNNNEFAFFS 
DELDDVRLLS 
DNVAEAAWLS 
DNTANSYWLS 
n fS 

661 



QPG.IPIRP. 
SPG.ZFLKF. 
RPG.ZFLKP. 
TPG . IPTKP . 
.... TPINP . 
WPGLIPEQPQ 
• MNIFNTNP. 
MMNI.KTNP. 
pg ip P 



RRLENIT. .N 
RNQEDNT . .G 
RNGEKMT. .E 
RNSENMS. .V 
RNMKPVL. .S 
RAGNEYLGLD 
RVSKFIPALE 
RVSKTIPALE 
Rn e 



KLAER . . LSD 
MLAHP . . TRG 
MLAKP . . TKA 
MLAKP . . TKQ 
MULES. .CDS 
MLASSYDEKG 
FKAVSFVESA 
FKAVSFVESA 
ffllA s 



QYPDVAEYIS 
KYPDIISRIP 
RYPEINITDF 
RYPDISVSVS 
HKVDYLKEYI 
LLKE . . .ELI 
HLNGFDKRWQ 
HLNGFDVRWK 

ypd 



FQQ 

PAEMLSKVGN 
I SEVLKRFEE 
INEVLORFQG 
ISEVLNTFDQ 
VNKAFKKFPS 
INKNIK.FP. 
VKKALETSG. 
IKKALDNAG. 
i e 1 f 



KYVKGN . 
KIKLPS. 
IQDLDT . 
KWKKPD. 
PKAFKK. 
KMTAEAROIH 
QLLNDDRCIF 
RLLNDDRCFY 
k 



D. amb. 

H. sap. 

S. cer. 

S. pom. 

Vacc. 

T4 

T6 

T3 

T7 

Kons . 



D. amb. 
H. sap. 
S . cer . 
S. pom. 
Vacc . 
T4 
T3 
T7 



D. amb. 

H. sap. 

S. cer. 

S. pom. 

Vacc. 

T4 

T3 

T7 

Kons . 



D. amb. 
H. sap. 
S . cer . 
S. pom. 
vacc . 
T4 
T3 
T7 

Kons . 

D . amb. 
H. sap. 
S. cer. 
S . pom . 
vacc . 
T4 
T3 
T7 

Kons . 



EGLDFLFDAY 
aH 

SGL. . LRTKW 
SGL. . LRTKW 



PETGEMRPFQ 
REKKQIQPFQ 
KDQGKZLPFQ 
RDENKILPFQ 
. EHNVPLPFG 
PENSKAKEFA 
penaicVJcDfT 
. VKRDNMGF . 
. TDTKNQEF . 
e Jc pFq 



ELMH RXR.KSD 

VLTT RKR.KEV 

VLST RKR.KDV 

KLAT RKR.KDV 

SLGI HK 

EVAESRTASN GIANKSLKGT 
e 

HLTNVPTKLT PKGREVIDGK 
HEELFVEPI. . . . RK . .KDK 
1 rkr k 



I 

AAFTCQYKTD 
IAL. VDYKYD 
AAFTCEYKYD 
ETFTSEY1CID 
AAFTCEYKYD 
GMF.AEVKYD 
.AF.AQLKAD 
. YLIADCKYD 
. YLIAEIKYD 
af aeyKyD 



. . EFZVEGEZ 
VTSFILDTEA 
TKNLILDCKA 
ARSFZLDCEA 
ATSIVLDSEI 
PEGVLXDGEL 
PDGFMLDGEL 
KDGFMLDGEL 
fildgE 



IHEAIKEYPV 
DASEIQV.QV 
ELNDVKV . KV 
KIGDIKV . RA 
KKEYKNS . MM 
ISEKEAQ . CM 



660 






GQR 




t 


GER. .GQIH . 




270 


GQR. .AQIHA 




578 


GER. .AQVHL 




429 


GER. .AQVHF 




426 


GER. .VQVH. 




241 


GARCFAEVRG 




171 


GVR. .GNIW 




44 


GVR. .GNICV 




44 


GeR aq*h 






660 






IPVD 




316 


VAWD 




626 


VAWD 




477 


VGWD 




474 


VLVD 




289 


VYHEQVKKEP 




228 


MVKGVDFNTG 




104 


MVKGVDFMTG 




104 


v d 







720 

NVFLFDLMYY 
CLYAFDLIYL 
CLFAFDILCY 
CLFAFDILYL 
CLFVFDCLYF 
KFQVWDYVPL 



FEFHLDPKRL SVRLYAVMPI 
VPFKLHTGHL HIKLYAILPL 
elf fd lyl 



721 

EGED 

NGES 

NDER 

NGQP 

DGFD 

VEIYS 

veVyG 

HIAESGEDYD 
HIVESGEDCD 

g 

781 

ISEGAEGVMV 
VKDSCEGLMV 
VNHSCEGLMV 
VKDSCEGLMV 
LTRKLEGLVL 
IDQGLEGZZL 
HAEGHEGLZV 
RAEGHEGLZV 
g EGlffiv* 

841 

GGKYSSF.LM 
AGRYGGF.LL 
TGTYGGF.LL 
TSVYGAF . LL 
GGIMAVF . LM 
T.KAGGF.ZL 
EGKVIGFSVL 
EGKVIGFEVL 
gkyggF 11 

901 

TM . . VPDVWL 
AV. .IPDHWL 
SA . . EPDVWF 
AH . . QPDVWF 
NKIYIPDFW 
RTRI 



. YTVKPL 
. LVREP L 
. LZNKSL 
. LLETPL 
.MTDZPL 
. LPAFRL 



S . ERRKKL . E 
S . RRRQLLRE 
K.ERREYLTK 
N . ERRKLLYS 
. YERRSFLKD 
KYDVRFSKLE 



SIVEDNDYVH 
NFVETEGEFV 
VTKWPGEFQ 
MFQPSTGDFT 
VMVErPNRIV 
QMTSGYDKVI 



IATHIITDNV 
FATSLDTKDZ 
YATQITTNNL 
FAKHSDQKSZ 
FSELTNISNE 
LIENQWNNL 



780 

EKLKEFFYQA 
EQIAEFLEQS 
DELQKFLDES 
ESIEEFLEES 
SQLTDVLDDA 
DEAKVIYKKY 



VQNLLMPYHV 
VMTLLMQEHV 
1 Pi 



KSL.APDAIY 
KTLDV.DATY 
KMLEGPESHY 
KMLEGPDSHY 
KDING. . .VY 
KNZDG. ..LW 
KD . . . PQGIY 
KD . . . PMCIY 
K 1 gp y 



AAYNPDKDVF 
ASYDEDSEEL 
GCYNQDTGEF 
GCYDPDTETV 
GCYDDE SGKW 
E. . .SECGKI 
. . . .LETGRL 
LESGRL 

y * g 



T.PAL. . VAE 

D. PSA. .VWE 

E . PTT . . LFE 
E.PKY. . LWE 
EDPKQSQIWE 
MENQNYYIGK 



E.AMRSLLVE YFPEI . 
K.NMLPLLQE YFPEI. 
err 11 e f e 



.EWL IAETYEVYDM DSLTELYEEK 
.EWQ AAESYEVYDM VELQQLYEQK 
e ae n 1 efle 



pd w 

961 

KSPEDATTNR 
KQPEQATTSA 
KGVEDATSSD 
KSWEDATTSE 
KTWKESTHLN 
KT . . KANTFE 

MPQEKM 

NPQEKM 

k e ac 



GFFSPYGIGD 
P e 



QAGSRGWLWZ 
EIAKRSHNWL 
EFSKRSRNWL 
EPSKRSRHWL 
EPGKR.R.WL 
ENA.RSKNLY 
KRGKKSG.WW 
KRGKKSG .WW 
e krs wl 



ETVCKVASGF 
QAICKLGTGF 
ETCCKIGTGF 
QSICKLGTGF 
KTVTK.CSGH 
K.VNA.GSGL 
. . VDA. . NNZ 
. . VNA. .TNI 
vck g gf 



IIGAErTISP 
VKCADLSLSP 
VLTADLSLSP 
VLAADLSLSP 
ISGAEFTSSK 
ILECECNGWL 
. . AKGEDFYN 
NDACTINPYD 
a sp 



KFKRDYQ.SE 
KLKKDYL . DG 
KXKKDYL.EG 
KVKKDYL . SG 
KZKR DYLWEG 

KFKE 

KLKPECEADG 
KKKPENEADG 
K K dyl g 



. MADTVDLVM 
. VC23TLDLW 
. VCTSLDLCV 
. VGDSLDLIV 
SMADSADLW 
.VID.VDLKI 
. IIQGVNWGT 
. IIQGLVWGT 
vdldl v 



840 

VGAFHGKGRK 
IGAYLGRGKR 
LGAYYGRGKR 
IGAYYGKGKR 
LGAYYGKGAK 
VGIYPHRKDP 

EGL AN 

KGL AN 

Gay g g 



TDAELDDLQK 
SDEELEEHHQ 
SDEMLQLLHD 
SEEHLETFYN 
DDNTLRVLQD 
KD . KAGVKSH 
SRALMDEFTS 
SRALMDEFTE 
Sd 1 



LHTCCKDQYA 
IYPAARGLVD 
IYKAGSATF. 
VYKAAIGYVQ 

SHTAN 

KSDGRTDY . . 
GWACQVNYME 
GWACQISYME 
a y 



900 

KIAELKRDTP HPRW S 

SLKALVLPSP RPYVRID..G 
RLTPTIIDGP KATFVFD..S 
QLKDIVISKK KDFYAHSDVP 
QLTMVKINKD PKKIPEWLW 

ELD 

NVK 

tvkeatlsq! '.'.'.'.'.'.'.\\\ 
lk 



EG.GLSIRFP 
SDKGISLRFF 
. DKGVSLRFP 
EDKGISLRFP 
. . .GZSZRFP 

VKLFLP 

ATPDGSLRKP 
ETPDGSZjRHP 
g slrfP 



960 

RFIRWR. .PD 
RFZRVR. .ED 
RFLRZR. .ED 
RFIRZR. .ED 
RFTRZR. .ED 

. . iairlred 
sfekfrgted 
sfvmfrgted 

rfiriR eD 



998 



356 
665 
516 
513 
323 
287 

160 
154 



404 
714 
565 
562 
371 
338 

217 
211 



461 
771 
623 
620 
426 
386 
267 
261 



516 
828 
680 
679 
464 
421 
302 
302 



568 
881 
731 
732 
534 
467 
340 
353 



EILEMYKSQL KKIEEKPSDQ SV 

QVACLYRKOS QIQNQQGEDS GSDPEDTY - 

QIVELYENQ . . . SHMQN - 

QVSEFYRSQV AYSQKEKEGS PAAEDY. . - 

DLVNLTKS - 

DVFGDFHEVT GL - 



y q 



600 
919 
755 
768 
552 
487 
346 
359 



FIG. 4b 



JSDOCID: <EP 0571880A1_I_> 



34 



EP 0 571 880 A1 



O 
LL 



< 



< 

z 
o 



J 



Ci 



c . n . *. 3. ^ n^ror-ir. c 

£ ^ \C in ^' (N* - - 



n n. 0\ r*. 

w-i 3C \c vd m 



•*! O. Pi cm 
o O X c 



tt «0 OC f*l O 3C — 



°- ""1 ^ **1 *0 « OC 



c . " o. n 50 in * « 
Tf CM sc c -* N 

CM CM CM CM CM CM CM £ 



rr sc 



3 ~ ^ 

cm m 

CM CM 



"i n. ^ 

s s a 



r- ^ °- 

«N CM 



CM CM CM CM 



no r-. oc 

8 R S 



cm oo 
oc <1 ~4 

8 - *1 



p\ ob m; 
^ _T cm ov 
2 v - o 



3 s- 5 2 s 

2 9 — © T 



£ S 2 5 £ - 5. 8 28 



_ a - - o 9 



00 CM CM VO vp — 

en O g r-. 



CM 

«n cm 



© «7 o © o 



" tt ~ ""i !2- °- <5 ^ 
3^0-79000 



^ cnooocrnO^irjcMf-^ 
5 ^ OC O o" — O 



~ m to 

s a s 



vO _ 

© Lr 5 2r ^ °\ — 

£ ? 9 9 © © © 9 9 - 



ON ^ 



a s § 5 a a 3 3 s 

^ 9 9 © - cm* o 9 



S 3. 2 = S £ 8 

^ 

oo m 



o — 



~ cm 

cm .0 !n 

~ = £ 

^ CM — 



3 3 R * R s 5 g $ 



_ S £ 

rv o-s' ^ v» w 

>C rs! °* — w o 

rv w »*> vj 5? 



5 -53 -fe .SS 



1 



^ 

^ C 5 
^ o 5 

« 



«o Q > 



< 
z 



vli. ^ 



5- -S^ « 



< 
Z 

0£ 



IjJ > h 



3NSDOCID. <EP 0571B80A1J_> 



35 



EP 0 571 880 A1 



FIG. 6 



CGGTTTTCAT r*ATPAAA TAT ATTA TATCGT AATTCAAACT TTTATIiaXG GAGTTTAAAA 

M E F K I 



Terminatoraequenz 

TTAAAGAAGA TTGAAGAAAA GCCGTCAGAT CAGAGTGTAT AAGTTTTTAT AAAATAACTC 2728 
LKKI EEK PSD Q S V * Ende des Proteins 

ATAGTTATGT TTTGTGTTCT TCGATATTAA GAAGTCTGGT GCAATACTTT TAGGTAACAA 2788 

iiiM Mi TransJcriptiona-Terminationssignal 
CTTTACAGTA GATGGACATT ATGAGCGAAA TTTTAGGGTT GTAACTCATT TTCATGCTGA 2848 



.0571880A1J_> 



36 



EP 0 571 880 A1 



FIG. 7 




iNSDOCID: <EP 0571880A1_L> 



37 



Europaisches 
Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nanner der Anmddung 

EP 93 10 8104 
PAGE1 





EINSCHLAGIGE DOKUMENTE 




Kategorii 


der maBeehBdiro Teilt 


Bctrifft 
Anspruch 


KLASSI FIXATION DER 
ANMELDUNG (lilt. CLS > 


X,0 
Y 


BIOCHEMICAL SOCIETY SYMPOSIA 
Bd. 58, 1992, LONDON 
Seiten 149 - 169 

DANSON, M. J., 0. W. HOUGH AND G. G. LUNT 
(ED. 'THE ARCHAEBACTERIA: BIOCHEMISTRY AND 
BIOTECHNOLOGY' 

& SYMPOSIUM, EDINBURGH, SCOTLAND, UK, 

SEPTEMBER 1991 

* das ganze Dokument * 


1,5.7 
10,15 


C12N9/00 
C12Q1/68 
C12N15/52 


D.Y 
A 


WO-A-9 117 239 (CORNELL RESEARCH 

FOUNDATION, INC.) 

* das ganze Dokument * 


10,15 
1 




A 


WO-A-8 705 907 (INSTITUT PASTEUR) 

* Seite 4, Zeile 6 - Seite 7, Zeile 20 * 


10,15 




A.D 


FEMS MICROBIOLOGY REVIEWS 

Bd. 75, Nr. 2-3, 1990, AMSTERDAM NL 

Seiten 117 - 124 

Stetter K 0; Fiala G; Huber G; Huber R; 
Segerer A 'Hyperthermophilic 
microorganisms - hyper-thermophilic 
bacterium taxonomy; review' 
• das ganze Dokument * 


5 








RECHERCH1ERTE 
SACHGEBtETE (Int. CLS ) 






C12N 
C12Q 


T 


ADVANCES IN BIOCHEMICAL 
ENGINEERING/BIOTECHNOLOGY 
Bd. 45, 1992, BERLIN DE 
Seiten 57 - 98 

COOLBEAR T; DANIEL RM; MORGAN HW 'The 

enzymes from extreme thermophiles: 

bacterial sources, thermostabilities and 

industrial relevance. 1 

" das ganze Dokument * 

• Seite 87, Zeile 10 - Zeile 37 « 

-/~ 


1 




Dtrw 


rtcgende Rccberchesbericht wurde fur tile Patntanspruche errtdlt 







BERLIN 



11 AUGUST 1993 



GURDJIAN 0. 



KATEGOUE DER GEN ANN TEN DOKUMENTE 

X : voo besooderer Bedeutong til an bctncbtet 

Y : voa besooderer Bedeutnng in Verbindung nit etaer 

aoderen VertffentUchuog icrsdbeo Kategorle 
A : techoologiscner Hintetgruod 
O : eucntsAriftHcne Offeabanutg 
P : " 



T : ier Erftndunt zngruoic negate Theories Oder Grundsatze 
E : Uteres Patentaokanent, das |edod> erst an oder 

aach den AameMedatun vcrOffe&tlicfal wotdca ist 
D : to der AameUung angefUhrtes Doktraent 
L : aus andcra Grunden angefUhrtes Dokument 

£ : Mlt5"ie7de7gid^'*P^ 



<EP . 0571880A1_L> 



Europaisches 
PatenUmt 



EUROPAISCHER RECHERCHENBERICHT 



Na 

EP 
PAGE2 



■er dcr Anmddung 

93 10 8104 



Katceorie 



EINSCHLAGIGE DOKUMENTE 



des Dokuments mit Angabe, soweh crforderikfa, 
dcr maBgcblkhen Tdk 



Betnflt 
Anspruch 



KLASStFtKATION DCR 
ANMELDUNG Out. CX5 ) 



BIOSIS PREVIEWS DATABASE , Phi 1 adel ph i a , 
Ab. Mo. 87107948 
KLETZIN A 

1 COUPLED ENZYMATIC PRODUCTION. . . 1 

* Zusammenfassung * 

& J BACTERIOL 171 (3). 1989. 1638-1643 

NUCLEIC ACIDS RESEARCH 

Bd. 20, Nr. 20, 1992, ARLINGTON, VIRGINIA 

US 

Seiten 5389 - 5396 

Kletzin A. 'Molecular characterisation of 
a DNA ligase gene of the extremely 
thermophilic archaeon Desulfurolobus 
ambivalens shows close phylogenetic 
relationship to eukaryotic ligases 1 

* das ganze Dokuraent * 



1,2 



1-14 



RECHEROQERTE 
SACHGEBIETE (Int. CL5 ) 



Dcr vorticgende Recbercbcnbcricht wurde fur aSc Pateataaspruche crstdlt 



BERLIN 



11 AUGUST 1993 



GURDJIAN D. 



KATEGORIE DER GEN ANN TEN DOKUMENTE 

X : von bcsooderer Bedottung aJldo betrachret 

Y : von besoodcrer Bedeatuog in Verbiadung ait esner 

andercn VaWfeadidning dersdben Kategorit 
A : teehnotogtsdwr HintoyunJ 
O : alcatschftftticne Offenfaarung 



T : der Erfindong zugrandc liegcntf e Theories oder Gntndtittet 
E : Uteres Patentdokument, das jedocb erst am Oder 

nad) fen Anaetdedatum verOffenttlcbt worden ist 
D : in der Anaetdnng ingefuhites Dokumeat 
j | Grttndeo f " *"* J 



der gtetcben Patentfanuiie, fibereinstinunendes 



BNSDOCID: <EP 0571B80A1J_> 



